求导公式:
-
C′=0(C为常数)C' = 0 \quad (C为常数)C′=0(C为常数)
-
(xn)′=nxn−1{(x^n)}' = n x^{n-1}(xn)′=nxn−1
-
(ex)′=ex{(e^x)}' = e^x(ex)′=ex
-
(ax)′=ln(a)ax{(a^x)}' = \ln(a)a^x(ax)′=ln(a)ax
-
(ln(x))′=1x{(\ln(x))}' = \dfrac 1 x(ln(x))′=x1
-
(loga(x))′=1ln(a)x{(\log_a(x))}' = \dfrac 1 {\ln(a)x}(loga(x))′=ln(a)x1
-
(sinx)′=cosx{(\sin x)}' = \cos x(sinx)′=cosx
-
(cosx)′=−sinx{(\cos x)}' = -\sin x(cosx)′=−sinx
-
(tanx)′=1cos2x{(\tan x)}' =\dfrac 1 {\cos ^2 x}(tanx)′=cos2x1
-
(cotx)′=−1sin2x{(\cot x)}' =-\dfrac 1 {\sin ^2 x}(cotx)′=−sin2x1
求导法则:
- (Cf(x))′=Cf′(x){(Cf(x))}' = C f'(x)(Cf(x))′=Cf′(x)
- (af(x)+bg(x))′=af′(x)+bg′(x){(af(x) + bg(x))}' = a f'(x) + bg'(x)(af(x)+bg(x))′=af′(x)+bg′(x)
- (f(x)g(x))′=f′(x)g(x)+f(x)g′(x){(f(x)g(x))}' = f'(x)g(x) + f(x) g'(x)(f(x)g(x))′=f′(x)g(x)+f(x)g′(x)
- (f(x)g(x)h(x))′=f′(x)g(x)h(x)+f(x)g′(x)h(x)+f(x)g(x)h′(x){(f(x)g(x)h(x))}' = f'(x)g(x)h(x) + f(x) g'(x)h(x) + f(x)g(x)h'(x)(f(x)g(x)h(x))′=f′(x)g(x)h(x)+f(x)g′(x)h(x)+f(x)g(x)h′(x)
- (f(x)g(x))′=f′(x)g(x)−f(x)g′(x)(g(x))2{\left (\dfrac {f(x)} {g(x)} \right )}' = \dfrac {f'(x)g(x) - f(x) g'(x)} {(g(x))^2}(g(x)f(x))′=(g(x))2f′(x)g(x)−f(x)g′(x)
链式法则:
牛顿记法: (f[g(x)])′=f′[g(x)]g′(x){(f[g(x)])}' = f'[g(x)] g'(x)(f[g(x)])′=f′[g(x)]g′(x)
或用莱布尼茨记法:df[g(x)]dx=df[g(x)]d[g(x)]dg(x)dx\dfrac {\rm {d f[g(x)]} } {\rm {dx}} = \dfrac {\rm {d f[g(x)]} } {\rm {d [g(x)]}} \dfrac {\rm {dg(x)} } {\rm {dx}}dxdf[g(x)]=d[g(x)]df[g(x)]dxdg(x) 牛顿记法中,f′(t)f'(t)f′(t)表示的是关于ttt的导数,而(f)′(f)'(f)′表示的是关于xxx的导数。莱布尼茨记法中分号下面dfdt\dfrac {\rm {df}} {\rm {dt}}dtdf表示的就是关于ttt的导数偏导数:
如果是多变量函数,如f(x,y)=by2+axy+cx+df(x,y)=by^2+axy+cx+df(x,y)=by2+axy+cx+d(几何上对应三维空间下的一个曲面),我们可以取x=x0x=x_0x=x0(几何上对应三维空间下的一个平面)代入,就会得到一个单变量函数:fx0(y)=by2+ax0y+cx0+df_{x_0}( y)=by^2+ax_0y+cx_0+dfx0(y)=by2+ax0y+cx0+d(几何上对应位于x=x0x=x_0x=x0平面上的一条曲线,实际就是曲面和平面的相交线)。对这个新函数fx0f_{x_0}fx0,我们可以求其关于y的导函数:(fx0(y))′=2by+ax0(f_{x_0}(y))' = 2by + ax_0(fx0(y))′=2by+ax0,此时的导数相当于曲面fff在x0x_0x0处的yyy方向上的变化率。
fff对于任意xxx值,都有一个单变量函数相对应(想象用所有垂直与x轴的平面与曲面相交)。这些单变量函数关于yyy的导函数的形式,都跟fff在x=x0x=x_0x=x0处的曲线fx0f_{x_0}fx0,关于yyy的导函数的形式一样(只不过把式中的x0x_0x0值换为其他值):(fx(y))′=2by+ax(f_{x}(y))' = 2by + ax(fx(y))′=2by+ax。我们称其为fff关于yyy的偏导数:∂f(x,y)∂y\dfrac {\partial {f(x,y)}} {\partial y}∂y∂f(x,y)。反映了曲面在yyy方向上的变化率。
推广到更多变量的函数,用一个超平面去和其相交,也能得到一个单变量函数。这个单变量函数的导数就是其在此单变量方向上的变化率。所以要求函数关于一个变量的偏导数,只需要将其他变量看作常数,如f(x,y)=by2+axy+cx+df(x,y)=by^2+axy+cx+df(x,y)=by2+axy+cx+d求fff关于yyy的偏导数就是把xxx当作常量看待对其求导: ∂f(x,y)∂y=2by+ax\dfrac {\partial {f(x,y)}} {\partial y} = 2by + ax∂y∂f(x,y)=2by+ax
梯度:
一个函数,如:f(x,y)f(x, y)f(x,y),其在点(x,y)(x,y)(x,y)上的关于xxx和yyy的偏导数组成的向量[∂f∂x,∂f∂y]\left [\dfrac {\partial f} {\partial x}, \dfrac {\partial f} {\partial y} \right ][∂x∂f,∂y∂f],就是fff在点(x,y)(x,y)(x,y)的梯度。
梯度是一个向量值函数,向量值函数的值域为一个线性空间或线性空间的子集,是一个标量点到向量的映射,记作:∇f\nabla f∇f。标量值函数fff在点aaa的梯度记为∇f(a)\nabla f(a)∇f(a)。
梯度的含义:假设f(x,y)f(x, y)f(x,y)是三维空间中一个曲面,则fff在点aaa的梯度是一个二维向量。点aaa沿梯度方向增加(自变量)值,函数值增长是最快的。而且梯度大小(向量长度)代表自变量增加一个单位向量,函数值的最大变化量。
向量场是把空间中的每一点指派到一个向量的映射,所以梯度就是一个向量场。
线性空间:线性空间里的元素有两种运算(加法和数乘),而且经过这两种运算(就是线性变换)得到的元素还在同一个线性空间中(所谓对这两种运算封闭)。
线性空间也叫向量空间。凸函数:
一个函数是凸的当且仅当其上境图(在函数图像上方的点集)为一个凸集
凸集就是集合内任意两点的连线上的点也都属于此集合。 (在国内数学教程,凸函数的概念有时被叫做凹函数)