基础微积分-多元函数微分

Chapter 8 多元函数微分

birthdeathstudy d time=life\int^{death}_{birth}study\ \text{d}\ time=life

Fragment 1 多元函数极限

· 平面点集

平面上的点 PP 可以用一有序实数对 (x,y)(x, y) 唯一表示

P1(x1,y1)P_1(x_1, y_1)P2(x2,y2)P_2(x_2, y_2) 的距离 d(P1,P2)=(x1x2)2+(y1y2)2d(P_1, P_2) = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2}

这样的定义满足如下的极限性质

  1. 正性: $d(P_1, P_2) \geq 0 $ ,且仅当 $ P_1 = P_2$ 等号成立
  2. 三角不等式: d(P1,P2)d(P1,P3)+d(P3,P2)d(P_1, P_2) \leq d(P_1, P_3) + d(P_3, P_2)

平面上满足某条件的点的集合称为平面点集。记作 E={PPE = \{ P \mid P 满足某条件 }\}

平面点列 {Pn}\{ P_n \} 是特殊的平面点集:

(1). 邻域

PnP_nδ\delta 圆的交为 {Pd(P,Pn)<δ}\{ P \mid d(P, P_n) < \delta \} ,记作 N(Pn,δ)N(P_n, \delta)

定义 P0P_0 为平面点 α\alpha 的极限为 {P0<d(P,Pn)<δ}\{ P \mid 0 < d(P, P_n) < \delta \} ,记作 Nα(Pn,δ)N_\alpha(P_n, \delta)

还有一种极限称为无穷极限,即以 P0P_0 为中心,以 δ\delta 为边长的方形区域,表示为平面极限

由于任一平面极限都可以包含于某一方形极限,反之亦然,所以极限与方形极限等价不加以区分

(2). 平面点集 EE 中的点 P0P_0 的分类

第一种分类方式:

  • 内点: δ>0\exists \delta > 0N(P0,δ)E=N(P_0, \delta) \cap E = \varnothing
  • 边界点: δ>0\exists \delta > 0N(P0,δ)EN(P_0, \delta) \cap E \neq \varnothingN(P0,δ)EN(P_0, \delta) \cap E \neq \varnothing

第二种分类方式:

  • 聚点:定义同上
  • 孤立点: $\exists \delta > 0 $ , $ N(P_0, \delta) \cap E = { P_0 }$
  1. 内点是极限点,边界点是极限点或孤立点;孤立点是极限点,聚点是内点或边界点
  2. 内点和聚点称为 EE :聚点全体记作 FF 又称为闭包,边界点全体记作 E\partial E

命题1:以下三个结论为 P0P_0 为极限点的等价描述:

  1. δ>0\forall \delta > 0N(P0,δ)EN(P_0, \delta) \cap E \neq \varnothing
  2. δ>0\forall \delta > 0N(P0,δ)EN(P_0, \delta) \cap E 是无穷集
  3. δ>0\forall \delta > 0N(P0,δ)EN(P_0, \delta) \cap E 至少有一个极限点

PS:内点和聚点是极限点,但极限点不一定是内点或聚点,例如分外的极限点

(3) 平面点集 EE 的分类

第一种分类方式:

  • 开集: EEE \subset E^*
  • 闭集: EEE^* \subset E
  • 边界: FEF \subset E

非开闭性: EE 成开集或闭集但不同时是

第二种分类方式:

  • 有界集: M>0\exists M > 0EN(O,M)E \subset N(O, M) ,其中 O(0,0)O(0, 0) 为坐标原点
  • 无界集: M>0\forall M > 0P0E\exists P_0 \in EP0N(O,M)P_0 \notin N(O, M)
  1. 定义极限的值域为 d(P1,P2)=supP1,P2Ed(P1,P2)d(P_1, P_2) = \sup_{P_1, P_2 \in E} d(P_1, P_2)EE 有界当且仅当 d(E)d(E) 为有限值
  2. 平面点集 {P1(x1,y1)}\{ P_1(x_1, y_1) \} 有界当且仅当 {xn}\{ x_n \}{yn}\{ y_n \} 均有限

命题2:设 FF 是闭集, GG 是开集,则 FGF∖G 是闭集, GFG∖F 是开集.

(4) 区域与闭区域

EE 中的点可以用有限条折线相互联结为区域集

连续的开集称为区域(开区域),开区域和闭集的边界点组成的区域

PS:闭区域是闭集的补集,但闭集的补集不一定是闭区域,例如分外的闭区域

· 二元函数极限

R2\mathbb{R}^2R\mathbb{R} 的映射是二元函数

/Define/

设平面点集 DR2D \subset \mathbb{R}^2,若按照某种对应法则 ffDD 中每一点 P(x,y)P(x, y) 都有唯一确定的 zRz \in \mathbb{R} 与之对应,则称 ff 为定义在 DD 上的二元函数,称 DDff 的定义域,PDP \in D 所对应的 zzff 在点 PP 的函数值,记作 z=f(P)z = f(P)z=f(x,y)z = f(x, y),全体函数值的集合为 ff 的值域,记作 f(D)Rf(D) \subset \mathbb{R}

在三维欧式空间中 S={(x,y,z)(x,y)D,z=f(x,y)}S = \{(x, y, z) | (x, y) \in D, z = f(x, y)\} 称为二元函数 ff 的图像。

/Define/

定义:设 ff 为定义在 DR2D \subset \mathbb{R}^2 上的二元函数,P0P_0DD 的一个聚点,AA 是一个确定的实数,若 ε>0\forall \varepsilon > 0δ>0\exists \delta > 0p(P0,δ)D\forall p \in (P_0, \delta) \cap Df(P)A<ε|f(P) - A| < \varepsilon,则称 AAffDD 上当 PP0P \to P_0 时的极限,记作

lim(x,y)(x0,y0)f(P)=Alimxx0yy0f(x,y)=Alim(x,y)(x0,y0)f(x,y)\lim_{(x, y) \to (x_0, y_0)} f(P) = A\quad \quad \lim_{\substack{x \to x_0 \\ y \to y_0}} f(x, y) = A\quad \quad\lim_{(x, y) \to (x_0, y_0)} f(x, y)

等价描述ε>0\forall \varepsilon > 0δ>0\exists \delta > 0xx0<δ\forall |x - x_0| < \deltayy0<δ|y - y_0| < \delta(x,y)(x0,y0)(x, y) \neq (x_0, y_0)f(x,y)A<ε|f(x, y) - A| < \varepsilon

定理(海涅定理):设 ff 为定义在 DR2D \subset \mathbb{R}^2 上的二元函数,P0P_0DD 的一个聚点,则 limPP0f(P)=A\lim_{P \to P_0} f(P) = A 的充分必要条件是对 DD 中任意满足 PnP0P_n \neq P_0PnP0P_n \to P_0nn \to \infty 的点列 {Pn}\{P_n\} 都有 limnf(Pn)=A\lim_{n \to \infty} f(P_n) = A

PS:用于证明极限不存在

  1. 若存在 {Pn}:PnP0\{P_n\} : P_n \to P_0limnf(Pn)\lim_{n \to \infty} f(P_n) 不存在
  2. 若存在 {Pn}:PnP1\{P_n\} : P_n \to P_1{Pn}:PnP2\{P_n'\} : P_n' \to P_2limnf(Pn)limnf(Pn)\lim_{n \to \infty} f(P_n) \neq \lim_{n \to \infty} f(P_n') ,则 limPP0f(P)\lim_{P \to P_0} f(P) 不存在

注意:逆命题不成立,即即使 limx0f(x,kx)A\lim_{x \to 0} f(x, kx) \equiv A 也不能说明 lim(x,y)(0,0)f(x,y)=A\lim_{(x, y) \to (0, 0)} f(x, y) = A

前面讨论的 lim(x,y)(x0,y0)f(x,y)\lim_{(x, y) \to (x_0, y_0)} f(x, y) 是两个自变量以任何路径靠近 (x0,y0)(x_0, y_0),称为重极限

定义:设 ff 为定义在 DR2D \subset \mathbb{R}^2 上的二元函数,DDxxyy 轴上的投影分别为 X,YX, Y,设 x0,y0x_0, y_0 分别是 X,YX, Y 的聚点。若对任意固定 yy0y \to y_0 yYy \to Y 存在极限 limxx0f(x,y)\lim_{x \to x_0} f(x, y)(一般与 yy 有关,是 yy 的函数),若进一步还存在极限 limyy0limxx0f(x,y)=A\lim_{y \to y_0} \lim_{x \to x_0} f(x, y) = A,称为 f(x,y)f(x, y) 先对 xx 后对 yy 的累次极限,记作 A21=limxx0limyy0f(x,y)A_{21} = \lim_{x \to x_0} \lim_{y \to y_0} f(x, y),类似地还有 f(x,y)f(x, y) 先对 yy0y \to y_0 的累次极限 A12=limyy0limxx0f(x,y)A_{12} = \lim_{y \to y_0} \lim_{x \to x_0} f(x, y),重极限记作 A=lim(x,y)(x0,y0)f(x,y)A = \lim_{(x, y) \to (x_0, y_0)} f(x, y)

注意:累次极限与重极限的存在性没有必然的蕴含关系

定理:若重极限 lim(x,y)(x0,y0)f(x,y)=A\lim_{(x, y) \to (x_0, y_0)} f(x, y) = A(有限或无限),且当 yy0y \neq y_0limxx0f(x,y)=φ(y)\lim_{x \to x_0} f(x, y) = \varphi(y) 存在,则有

limyy0limxx0f(x,y)=limxx0φ(y)=A\lim_{y \to y_0} \lim_{x \to x_0} f(x, y) = \lim_{x \to x_0} \varphi(y) = A

/proof/

AA 有限时,ε>0\forall \varepsilon > 0δ>0\exists \delta > 0xx0<δ\forall |x - x_0| < \deltayy0<δ|y - y_0| < \delta(x,y)(x0,y0)(x, y) \neq (x_0, y_0) 时,有 f(x,y)A<ε|f(x, y) - A| < \varepsilon

对固定的 yy0y \neq y_0,由于 limxx0f(x,y)=φ(y)\lim_{x \to x_0} f(x, y) = \varphi(y),则上式取极限 xx0x \to x_0

知当 yy0<δ|y - y_0| < \delta 时,有 φ(y)A<ε|\varphi(y) - A| < \varepsilonAA 无限的情况同理

注意

  1. 若重极限与两个累次极限都存在,则三者必相等
  2. 若两个累次极限存在但不相等,则重极限不存在

· 二元函数连续性

/Define/

ff 为定义在 DR2D \subset \mathbb{R}^2 上的二元函数,P0DP_0 \in D(聚点或孤立点)若 ε>0\forall \varepsilon > 0δ>0\exists \delta > 0PN(P0,δ)D\forall P \in N(P_0, \delta) \cap Df(P)f(P0)<ε|f(P) - f(P_0)| < \varepsilon,则称 ff 关于 DDP0P_0 连续,等价描述为 limPP0f(P)=f(P0)\lim_{P \to P_0} f(P) = f(P_0)。若 PP 上下任何点都连续,称 ffDD 上的连续函数。

  1. P0P_0DD 的孤立点,则 P0P_0 必是 ff 关于 DD 的连续点
  2. limPP0f(P)\lim_{P \to P_0} f(P) 存在但不等于 f(P0)f(P_0),称 P0P_0ff 的可去间断点

定理(复合函数的连续性):设 f(x,y)f(x, y)(x0,y0)(x_0, y_0) 连续,而 x=φ(s,t)x = \varphi(s, t)y=ψ(s,t)y = \psi(s, t)(s0,t0)(s_0, t_0) 连续,x0=φ(s0,t0)x_0 = \varphi(s_0, t_0)y0=ψ(s0,t0)y_0 = \psi(s_0, t_0),则复合函数 g(s,t)=f(φ(s,t),ψ(s,t))g(s, t) = f(\varphi(s, t), \psi(s, t))(s0,t0)(s_0, t_0) 连续。

Fragment 2 偏导数 全微分

· 基础概念

若将二元函数中的一个变量固定,则二元函数就退化为了一元函数,此时我们可以考虑微分。

/Define/

z=f(x,y)z = f(x, y)(x0,y0)(x_0, y_0) 的某邻域上有定义,若极限

limΔx0f(x0+Δx,y0)f(x0,y0)Δx \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x, y_0) - f(x_0, y_0)}{\Delta x}

存在,称为 zz(x0,y0)(x_0, y_0) 关于 xx 的偏导数,记为

zx(x0,y0) or fx(x0,y0) or zx(x0,y0) or fx(x0,y0)z_x(x_0, y_0) \text{ or } f_x(x_0, y_0) \text{ or } \frac{\partial z}{\partial x} \bigg|_{(x_0, y_0)} \text{ or } \frac{\partial f}{\partial x} \bigg|_{(x_0, y_0)}

zzEE 上每一点都可导,则称 zzEE 上可导, fx(x,y)f_x(x, y)fy(x,y)f_y(x, y) 称为偏导函数。

z=f(x,y)z = f(x, y)(x0,y0)(x_0, y_0) 可导,是否一定连续?

反例: f(x,y)={1xy00xy=0f(x, y) = \begin{cases} 1 & xy \neq 0 \\ 0 & xy = 0 \end{cases}(0,0)(0, 0) 处可导但不连续,可导不一定连续。


我们已经在二元函数定义了偏导数概念

回顾一元微分:如果 y=f(x)y = f(x)x0x_0 点某邻域上有定义,且

Δy=f(x0+Δx)f(x0) \Delta y = f(x_0 + \Delta x) - f(x_0)

能写成 A(x)Δx+o(Δx)(Δx0)A(x) \Delta x + o(\Delta x) (\Delta x \to 0) 的形式,则称 y=f(x)y = f(x)x0x_0 点可微, AΔxA \Delta x 称为 yyx0x_0 点的微分,记为 dy=Adxdy = A dx

我们可以将其推广到二元函数上

/Define/

设 $ z = f(x, y) $ 在 $ (x_0, y_0) $ 点某邻域上有定义,且

Δz=f(x0+Δx,y0+Δy)f(x0,y0) \Delta z = f(x_0 + \Delta x, y_0 + \Delta y) - f(x_0, y_0)

可以表示成 AΔx+BΔy+o(ρ)A \Delta x + B \Delta y + o(\rho)

ρ=Δx2+Δy2 \rho = \sqrt{\Delta x^2 + \Delta y^2}

的形式则称 z=f(x,y)z = f(x, y)(x0,y0)(x_0, y_0) 点可微。 AΔx+BΔyA \Delta x + B \Delta y 称为 zz(x0,y0)(x_0, y_0) 点的微分,记为 dz(x0,y0)=Adx+Bdydz|_{(x_0, y_0)} = A dx + B dy

不同于偏导数,全微分蕴含了函数某点处所有方向的信息,因此可微的条件比可导更强。

定理1:若 z=f(x,y)z = f(x, y)(x0,y0)(x_0, y_0) 可微,则 zz(x0,y0)(x_0, y_0) 点连续

/proof/

lim(x,y)(x0,y0)f(x,y)=limΔx0f(x0+Δx,y0+Δy)=limΔx0f(x0,y0)+AΔx+BΔy+o(ρ)=f(x0,y0)(Δy0)\begin{align*} \lim_{(x, y) \to (x_0, y_0)} f(x, y) &= \lim_{\Delta x \to 0} f(x_0 + \Delta x, y_0 + \Delta y)\\ &= \lim_{\Delta x \to 0} f(x_0, y_0) + A \Delta x + B \Delta y + o(\rho) \\ &= f(x_0, y_0) \quad(\Delta y \to 0) \end{align*}

下面的定理说明了全微分与偏导数的关系。

定理2:若 z=f(x,y)z = f(x, y)(x,y)(x, y) 可微 dz(x,y)=Adx+Bdydz(x, y) = A dx + B dy ,则 A=fx(x,y)A = f_x(x, y)B=fy(x,y)B = f_y(x, y)

/proof/

固定 yy ,即 Δy=0\Delta y = 0 ,则 ρ=Δx\rho = |\Delta x|

f(x+Δx,y)f(x,y)=AΔx+o(Δx)f(x + \Delta x, y) - f(x, y) = A \Delta x + o(|\Delta x|)

f(x+Δx,y)f(x,y)Δx=A+o(Δx)Δx\Rightarrow \frac{f(x + \Delta x, y) - f(x, y)}{\Delta x} = A + \frac{o(|\Delta x|)}{\Delta x}

上式取极限 Δx0\Delta x \to 0 ,则得到 fx(x,y)=Af_x(x, y) = A

注意:

  1. 二元 dz=fxdx+fydydz = f_x dx + f_y dy ,三元 du=fxdx+fydy+fzdzdu = f_x dx + f_y dy + f_z dz
  2. 可微一定连续,可微一定可导

二元函数全微分与一元函数微分一样具有几何意义

(1). 一元函数 y=f(x)y = f(x)

(x0,y0)(x_0, y_0) 处的微分 dy=f(x0)dxdy = f'(x_0) dx

(x0,y0)(x_0, y_0) 处的切线 yy0=f(x0)(xx0)y - y_0 = f'(x_0)(x - x_0)

(2). 二元函数 z=f(x,y)z = f(x, y)

(x0,y0,z0)(x_0, y_0, z_0) 处的微分 dz=fx(x0,y0)dx+fy(x0,y0)dydz = f_x(x_0, y_0) dx + f_y(x_0, y_0) dy

(x0,y0,z0)(x_0, y_0, z_0) 处的切面 zz0=fx(x0,y0)(xx0)+fy(x0,y0)(yy0)z - z_0 = f_x(x_0, y_0)(x - x_0) + f_y(x_0, y_0)(y - y_0)

· 可微性验证

根据定义,验证多元函数的可微性只需验证下式是否成立

ΔzfxΔxfyΔy=o(ρ)limρ0+ΔzfxΔxfyΔyρ=0\Delta z - f_x \Delta x - f_y \Delta y = o(\rho) \Leftrightarrow \lim_{\rho \to 0^+} \frac{\Delta z - f_x \Delta x - f_y \Delta y}{\rho} = 0

/example/ z=xyz = \sqrt{|xy|}zz(0,0)(0, 0)处是否可微?

/solution/

fx(0,0)=limΔx0Δx00Δx=0f_x(0, 0) = \lim_{\Delta x \to 0} \frac{\sqrt{\Delta x \cdot 0} - 0}{\Delta x} = 0fy(0,0)=0f_y(0, 0) = 0

limρ0+(ΔxΔy0)0Δx0Δyρ=limρ0+sinθcosθ\lim_{\rho \to 0^+} \frac{(\sqrt{\Delta x \Delta y} - 0) - 0 \Delta x - 0 \Delta y}{\rho} = \lim_{\rho \to 0^+} \sqrt{|\sin \theta \cos \theta|}

不存在,故不可微

定理3:若 z=f(x,y)z = f(x, y)(x,y)(x, y)的某邻域可导,且偏导函数 fx(x,y)f_x(x, y)fy(x,y)f_y(x, y)(x,y)(x, y)点连续,则 f(x,y)f(x, y)(x,y)(x, y)点可微。

/proof/

Δz=f(x+Δx,y+Δy)f(x,y)=f(x+Δx,y+Δy)f(x+Δx,y)+f(x+Δx,y)f(x,y)\begin{align*} \Delta z &= f(x + \Delta x, y + \Delta y) - f(x, y)\\ &= f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) + f(x + \Delta x, y) - f(x, y) \end{align*}

由条件知当 Δx\Delta xΔy\Delta y充分小时 f(x,y)f(x, y)可导

f(x+Δx,y)f(x + \Delta x, y)看作是 yy的一元函数,根据拉格朗日中值定理,存在 θ1(0,1)\theta_1 \in (0, 1)使得

f(x+Δx,y+Δy)f(x+Δx,y)=fy(x+Δx,y+θ1Δy)Δyf(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) = f_y(x + \Delta x, y + \theta_1 \Delta y) \Delta y

同理存在 θ2(0,1)\theta_2 \in (0, 1)使得 f(x+Δx,y)f(x,y)=fx(x+θ2Δx,y)Δxf(x + \Delta x, y) - f(x, y) = f_x(x + \theta_2 \Delta x, y) \Delta x

从而

Δzfx(x,y)Δxfy(x,y)Δy\Delta z - f_x(x, y) \Delta x - f_y(x, y) \Delta y

=[fy(x+Δx,y+θ1Δy)fy(x,y)]Δy+[fx(x+θ2Δx,y)fx(x,y)]Δx= [f_y(x + \Delta x, y + \theta_1 \Delta y) - f_y(x, y)] \Delta y + [f_x(x + \theta_2 \Delta x, y) - f_x(x, y)] \Delta x

由于 fx(x,y)f_x(x, y)fy(x,y)f_y(x, y)(x,y)(x, y)点连续

fy(x+Δx,y+θ1Δy)fy(x,y)0(ρ0+)f_y(x + \Delta x, y + \theta_1 \Delta y) - f_y(x, y) \rightarrow 0 \, (\rho \rightarrow 0^+) ,记为 o(1)o(1)

同理 fx(x+θ2Δx,y)fx(x,y)=o(1)f_x(x + \theta_2 \Delta x, y) - f_x(x, y) = o(1) ,所以

limρ0+Δzfx(x,y)Δxfy(x,y)Δyρ=limρ0+(o(1)Δxρ+o(1)Δyρ)\lim_{\rho \to 0^+} \frac{\Delta z - f_x(x, y) \Delta x - f_y(x, y) \Delta y}{\rho} = \lim_{\rho \to 0^+} \left( o(1) \frac{\Delta x}{\rho} + o(1) \frac{\Delta y}{\rho} \right)

又因为 Δxρ,Δyρ1\left| \frac{\Delta x}{\rho} \right|, \left| \frac{\Delta y}{\rho} \right| \leq 1 ,所以上面的极限为零,故 f(x,y)f(x, y)(x,y)(x, y) 点可微


(1). 若将条件增强,假设 fxf_xfyf_y(x,y)(x, y)的某邻域连续,可利用微积分基本定理

f(x+Δx,y+Δy)f(x+Δx,y)=yy+Δyfy(x+Δx,s)ds=yy+Δy[fy(x,y)+o(1)]ds=fy(x,y)Δy+o(1)Δy\begin{align*} f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) = \int_y^{y+\Delta y} f_y(x + \Delta x, s) ds\\ = \int_y^{y+\Delta y} [f_y(x, y) + o(1)] ds = f_y(x, y) \Delta y + o(1) \Delta y \end{align*}

后续步骤省略
(2). 逆命题不成立,即偏导函数连续不是可微的必要条件

反例:f(x,y)={(x2+y2)sin1x2+y2x2+y200x2+y2=0f(x, y) = \begin{cases} (x^2 + y^2) \sin \frac{1}{x^2 + y^2} & x^2 + y^2 \neq 0 \\ 0 & x^2 + y^2 = 0 \end{cases}

(3). 由证明可以看出,可微性只需验证 Δz=fxΔx+fyΔy+o(1)Δx+o(1)Δy\Delta z = f_x \Delta x + f_y \Delta y + o(1) \Delta x + o(1) \Delta y

将上面的叙述严格的语言写出来,就是如下的引理

引理1:Δz=fxΔx+fyΔy+o(1)Δx+o(1)Δy\Delta z = f_x \Delta x + f_y \Delta y + o(1) \Delta x + o(1) \Delta y等价于

Δz=fxΔx+fyΔy+o(ρ)ρ0+\Delta z = f_x \Delta x + f_y \Delta y + o(\rho),\rho \to 0^+

/proof/

必要性在证明过程中已经体现,下证充分性

事实上,我们只需证明 o(ρ)o(\rho)可以分解成 o(1)Δx+o(1)Δyo(1) \Delta x + o(1) \Delta y即可

任取 f(x,y)=o(ρ)f(x, y) = o(\rho),有 limρ0+f(x,y)ρ=0\lim_{\rho \to 0^+} \frac{f(x, y)}{\rho} = 0,从而 f(x,y)ρ=o(1)\frac{f(x, y)}{\rho} = o(1)

f1(x,y)=f(x,y)ρΔx=o(1)Δxf_1(x, y) = \frac{f(x, y)}{\rho} |\Delta x| = o(1) \Delta x

f2(x,y)=f(x,y)f1(x,y)=f(x,y)ρ(ρΔx)Δyf_2(x, y) = f(x, y) - f_1(x, y) = \frac{f(x, y)}{\rho} (\rho - |\Delta x|) \Delta y

从而 f(x,y)=f1(x,y)+f2(x,y)f(x, y) = f_1(x, y) + f_2(x, y)

(4). 证明过程中利用到中值定理,可以归结为如下二元函数的中值定理

引理2:若 z=f(x,y)z = f(x, y)(x,y)(x, y) 的某邻域可导,则当 Δx\Delta xΔy\Delta y 充分小时,全增量

Δz=fx(x+θ1Δx,y+Δy)Δx+fy(x,y+θ2Δy)Δy \Delta z = f_x(x + \theta_1 \Delta x, y + \Delta y) \Delta x + f_y(x, y + \theta_2 \Delta y) \Delta y

其中 θ1,θ2(0,1)\theta_1, \theta_2 \in (0, 1)


· 高阶偏导

/Define/

二元函数 z=f(x,y)z = f(x, y) 的偏导数 fx(x,y)f_x(x, y) 仍是二元函数,若其仍然可导,其对 xx 的偏导数记为 fxxf_{xx}2fx2\frac{\partial^2 f}{\partial x^2} ;对 yy 的偏导数记为 fxyf_{xy}2fxy\frac{\partial^2 f}{\partial x \partial y} ,类似地还有 fyxf_{yx}fyyf_{yy} 。其中 fxyf_{xy}fyxf_{yx} 称为二阶混合偏导数

事实上,二阶混合偏导数 $ f_{xy} $ 与 fyxf_{yx} 并不一定相等。

反例: f(x,y)={x2y2y2x2+y2x2+y200x2+y2=0f(x, y) = \begin{cases} \frac{x^2 y^2 - y^2}{x^2 + y^2} & x^2 + y^2 \neq 0 \\ 0 & x^2 + y^2 = 0 \end{cases}

我们将 fxy(x,y)f_{xy}(x, y) 表示成极限,即 fx(x,y)=limΔx0f(x+Δx,y)f(x,y)Δxf_x(x, y) = \lim_{\Delta x \to 0} \frac{f(x + \Delta x, y) - f(x, y)}{\Delta x} ,从而

fxy(x,y)=limΔy0fx(x,y+Δy)fx(x,y)Δy=limΔy0limΔx0f(x+Δx,y+Δy)f(x,y+Δy)f(x+Δx,y)+f(x,y)ΔxΔy\begin{align*} f_{xy}(x, y) &= \lim_{\Delta y \to 0} \frac{f_x(x, y + \Delta y) - f_x(x, y)}{\Delta y}\\ &= \lim_{\Delta y \to 0} \lim_{\Delta x \to 0} \frac{f(x + \Delta x, y + \Delta y) - f(x, y + \Delta y) - f(x + \Delta x, y) + f(x, y)}{\Delta x \Delta y} \end{align*}

同理

fyx(x,y)=limΔy0limΔx0f(x+Δx,y+Δy)f(x+Δx,y)f(x,y+Δy)+f(x,y)ΔxΔyf_{yx}(x, y) = \lim_{\Delta y \to 0} \lim_{\Delta x \to 0} \frac{f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) - f(x, y + \Delta y) + f(x, y)}{\Delta x \Delta y}

于是 fxyf_{xy}fyxf_{yx} 是否相等归结于上面两个累次极限能否换序的问题

定理4:若 fxy(x,y)f_{xy}(x, y)fyx(x,y)f_{yx}(x, y)(x,y)(x, y) 连续,则二者相等。

证明过程略(饶了我吧)


  1. 推广到 $ n $ 阶偏导,若 $ f $ 具有直到 $ n $ 阶的连续偏导数,则混合偏导数与求导顺序无关
  2. 在数学分析中,今后都默认多元函数的偏导数连续,从而混合偏导数与求导顺序无关。为了叙述方便,我们引入记号 $ C^k(E) $ ,其中 $ E \subset \mathbb{R}^2, k \geq +\infty $ 表示全体不超过 $ k $ 阶的所有偏导数都在 $ E $ 连续的函数的集合

由于我们默认高阶偏导的求导顺序可以交换,我们可以定义微分算子的记号

(ax+by)nnfxiyj=i=0nCni(ax)i(by)ni=i=0nCniaibninxiyni\left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right)^n \frac{\partial^n f}{\partial x^i \partial y^j} = \sum_{i=0}^n C_n^i \left( a \frac{\partial}{\partial x} \right)^i \left( b \frac{\partial}{\partial y} \right)^{n-i} = \sum_{i=0}^n C_n^i a^i b^{n-i} \frac{\partial^n}{\partial x^i \partial y^{n-i}}

(ax+by)nf=i=0nCniaibninfxiyni\left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right)^n f = \sum_{i=0}^n C_n^i a^i b^{n-i} \frac{\partial^n f}{\partial x^i \partial y^{n-i}}

注意,此记号只是形式上写成幂次形式,不能把 (ax+by)n\left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right)^n 理解为 nn(ax+by)\left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right) 的复合

Fragment 3 复合函数微分法

· 复合函数的偏导数

在一元函数微分学中,复合函数 z=f(y)z = f(y)y=g(x)y = g(x) ,有链式法则 dzdx=dzdydydx\frac{dz}{dx} = \frac{dz}{dy} \frac{dy}{dx}

而二元复合函数 z=f(x,y)z = f(x, y)z=φ(s,t)z = \varphi(s, t)y=ψ(s,t)y = \psi(s, t) 能否求导?如何求导?

定理(链式法则):对上述二元复合函数,若 xs,xt,ys,ytx_s, x_t, y_s, y_t(s,t)(s, t) 存在,且 ff(s,t)(s, t) 对应的 (x,y)(x, y) 可微,则复合函数在 (s,t)(s, t) 的偏导数存在,且

zs=fxxs+fyyszt=fxxt+fyyt\frac{\partial z}{\partial s} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial s} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial s} \\ \frac{\partial z}{\partial t} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial t} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial t}

(1). 定理中可微的条件不可以省略

(2). 其中 fx,fy\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} 是关于 $ x, y $ 的二元函数, xs,xt,ys,yt\frac{\partial x}{\partial s}, \frac{\partial x}{\partial t}, \frac{\partial y}{\partial s}, \frac{\partial y}{\partial t} 是关于 s,ts, t 的二元函数

(3). 上式可以写成矩阵形式

[zszt]=[xsysxtyt][fxfy]\begin{bmatrix} \frac{\partial z}{\partial s} \\ \frac{\partial z}{\partial t} \end{bmatrix} =\begin{bmatrix} \frac{\partial x}{\partial s} & \frac{\partial y}{\partial s} \\ \frac{\partial x}{\partial t} & \frac{\partial y}{\partial t} \end{bmatrix} \begin{bmatrix} \frac{\partial f}{\partial x} \\ \frac{\partial f}{\partial y} \end{bmatrix}

其中

[xsysxtyt]\begin{bmatrix} \frac{\partial x}{\partial s} & \frac{\partial y}{\partial s} \\ \frac{\partial x}{\partial t} & \frac{\partial y}{\partial t} \end{bmatrix}

称为雅可比矩阵

(4). 从微分的角度(一阶全微分形式的不变性)

{dx=φsds+φtdtdy=ψsds+ψtdt\begin{cases} dx = \varphi_s ds + \varphi_t dt \\ dy = \psi_s ds + \psi_t dt \end{cases} 代入 dz=fxdx+fydydz = f_x dx + f_y dy ,得到

dz=(fxφs+fyψs)ds+(fxφt+fyψt)dtdz = (f_x \varphi_s + f_y \psi_s) ds + (f_x \varphi_t + f_y \psi_t) dt

根据全微分表示式可写成:

{zs=fxφs+fyψszt=fxφt+fyψt\begin{cases} z_s = f_x \varphi_s + f_y \psi_s \\ z_t = f_x \varphi_t + f_y \psi_t \end{cases}

/example/ z=f(x,y,t)z = f(x, y, t)x=φ(s,t)x = \varphi(s, t)y=ψ(s,t)y = \psi(s, t),求 zsz_sztz_t

/solution/ zs=fxxs+fyysz_s = f_x x_s + f_y y_szt=fxxt+fyyt+ftz_t = f_x x_t + f_y y_t + f_t

注意第二个式子左边的 zsz_s 和右边的 ftf_t 表达的含义是不同的

其中 xtx_t 是指将自变量 z=f(x,y,t)z = f(x, y, t) 看成关于 s,ts, t 的复合函数

(也就是 z=f(φ(s,t),ψ(s,t),t)z = f(\varphi(s, t), \psi(s, t), t))再对 tt 求偏导,所以 ztz_t 也是关于 s,ts, t 的函数

ftf_t 则是指将 ff 看作三元函数再对第三个分量求偏导,ftf_t 是关于 x,y,tx, y, t 的函数

进一步解释,就是将 ff 看成 R3\mathbb{R}^3R\mathbb{R} 的映射,即 f:(a,b,c)f(a,b,c)f: (a, b, c) \longrightarrow f(a, b, c)

这里的 a,b,ca, b, c 是什么字母并不重要,重要的只是它们的顺序

为了避免歧义,我们今后将这里的 fx,fy,ftf_x, f_y, f_t 记作 f1,f2,f3f_1, f_2, f_3,表示对分量求偏导

所以本题也可以写作 zs=f1xs+f2ysz_s = f_1 x_s + f_2 y_szt=f1xt+f2yt+f3z_t = f_1 x_t + f_2 y_t + f_3

· 隐函数偏导数

在此部分,我们总是假设隐函数(组)是存在的,且性质足够好,是可导的. (至于在什么条件下此假设成立,那是数学分析和高等微积分要干的事情,我们直接跳过不做过多讨论)

对于单个方程来说:设 F(x,y)=0F(x, y) = 0 定义了一个函数 y=y(x)y = y(x),如何求 y(x)y'(x)

求导法F(x,y)=0F(x, y) = 0y=y(x)y = y(x) 为二元复合函数

xx 求导 Fx+Fyy(x)=0F_x + F_y y'(x) = 0,故 y(x)=FxFyy'(x) = -\frac{F_x}{F_y}

微分法:对 F(x,y)=0F(x, y) = 0 微分 Fxdx+Fydy=0F_x dx + F_y dy = 0,故 dydx=FxFy\frac{dy}{dx} = -\frac{F_x}{F_y}

PS:默认 Fy0F_y \neq 0,上述方法可以推广到多元的情况

Q:设 F(x,y,z)=0F(x, y, z) = 0 定义了一个函数 z=z(x,y)z = z(x, y),如何求 zx\frac{\partial z}{\partial x}zy\frac{\partial z}{\partial y}

法一(求导法)F(x,y,z)=0F(x, y, z) = 0z=z(x,y)z = z(x, y) 为三元复合函数

xx 求偏导 Fx+Fzzx=0F_x + F_z \frac{\partial z}{\partial x} = 0,故 zx=FxFz\frac{\partial z}{\partial x} = -\frac{F_x}{F_z},同理对 yy 求偏导得 zy=FyFz\frac{\partial z}{\partial y} = -\frac{F_y}{F_z}

法二(微分法):对 F(x,y,z)=0F(x, y, z) = 0 微分 Fxdx+Fydy+Fzdz=0F_x dx + F_y dy + F_z dz = 0,移项得

dz=FxFzdxFyFzdy,zx=FxFz,zy=FyFzdz = -\frac{F_x}{F_z} dx - \frac{F_y}{F_z} dy,\quad \frac{\partial z}{\partial x} = -\frac{F_x}{F_z},\quad \frac{\partial z}{\partial y} = -\frac{F_y}{F_z}

PS:同时算多个偏导数时,用微分法比较简单。


考虑方程组

{F(x,y,z)=0G(x,y,z)=0\begin{cases} F(x, y, z) = 0 \\ G(x, y, z) = 0 \end{cases}

在定义域内任取 xx(固定),则方程组退化为关于 y,zy, z 的二元线性方程组

若方程组性质足够好,可以解出唯一解 y,zy, z,则我们说其定义了隐函数组

{y=y(x)z=z(x)\begin{cases} y = y(x) \\ z = z(x) \end{cases}

进一步,若这两个隐函数可导,如何求 y(x)y'(x)z(x)z'(x)

求导法:将 y=y(x),z=z(x)y = y(x), z = z(x) 带入方程组,即

{F(x,y(x),z(x))=0G(x,y(x),z(x))=0\begin{cases} F(x, y(x), z(x)) = 0 \\ G(x, y(x), z(x)) = 0 \end{cases}

此时左边是关于 xx 的复合函数,求导得

{Fx+Fyy(x)+Fzz(x)=0Gx+Gyy(x)+Gzz(x)=0\begin{cases} F_x + F_y y'(x) + F_z z'(x) = 0 \\ G_x + G_y y'(x) + G_z z'(x) = 0 \end{cases}

写成矩阵的形式就是

(FyFzGyGz)(yz)=(FxGx)\begin{pmatrix} F_y & F_z \\ G_y & G_z \end{pmatrix} \begin{pmatrix} y' \\ z' \end{pmatrix} = \begin{pmatrix} -F_x \\ -G_x \end{pmatrix}

左边第一矩阵称为雅可比矩阵,引入记号 (F,G)(y,z)=FyFzGyGz\frac{\partial (F, G)}{\partial (y, z)} = \begin{vmatrix} F_y & F_z \\ G_y & G_z \end{vmatrix} 表示其行列式

(F,G)(y,z)=FyFzGyGz0\frac{\partial (F, G)}{\partial (y, z)} = \begin{vmatrix} F_y & F_z \\ G_y & G_z \end{vmatrix} \neq 0,则雅可比矩阵可逆

从而可以解得

(yz)=(FyFzGyGz)1(FxGx)\begin{pmatrix} y' \\ z' \end{pmatrix} = \begin{pmatrix} F_y & F_z \\ G_y & G_z \end{pmatrix}^{-1} \begin{pmatrix} -F_x \\ -G_x \end{pmatrix}

微分法:对方程组求微分得

{Fxdx+Fydy+Fzdz=0Gxdx+Gydy+Gzdz=0\begin{cases} F_x dx + F_y dy + F_z dz = 0 \\ G_x dx + G_y dy + G_z dz = 0 \end{cases}

写成矩阵的形式

(FyFzGyGz)(dydz)=(FxGx)dx\begin{pmatrix} F_y & F_z \\ G_y & G_z \end{pmatrix} \begin{pmatrix} dy \\ dz \end{pmatrix} = \begin{pmatrix} -F_x \\ -G_x \end{pmatrix} dx

后续步骤同理

Fragment 4 方向导数 梯度

前面我们定义了二元函数 f(x,y)f(x, y) 的偏导数 fx(x0,y0)f_x(x_0, y_0)fy(x0,y0)f_y(x_0, y_0)

它们分别是沿两个坐标轴方向求导,现在我们来定义任意方向上的导数

/Define/

f(x,y)f(x, y)P0(x0,y0)P_0(x_0, y_0) 的某邻域内有定义,记单位方向向量 l=(α,β)\vec{l} = (\alpha, \beta) 满足 α2+β2=1\alpha^2 + \beta^2 = 1,若极限

limt0+f(x0+tα,y0+tβ)f(x0,y0)t\lim_{t \to 0^+} \frac{f(x_0 + t\alpha, y_0 + t\beta) - f(x_0, y_0)}{t}

存在,则称为 ffP0P_0 沿方向 ll 的方向导数,记为 flP0\frac{\partial f}{\partial l}\bigg|_{P_0}fl(P0)f_l(P_0)

注意:若 l=(1,0)\vec{l} = (1, 0),则 fl(P0)=limt0+f(x0+t,y0)f(x0,y0)t=fx(P0)f_l(P_0) = \lim_{t \to 0^+} \frac{f(x_0 + t, y_0) - f(x_0, y_0)}{t} = f_x(P_0);若 l=(1,0)\vec{l} = (-1, 0),则 fl(P0)=fx(P0)f_l(P_0) = -f_x(P_0)(区分正负)。

方向导数的定义可以推广到 nn 元函数

/Define/

f(x1,,xn)f(x_1, \ldots, x_n)P0(x1(0),,xn(0))P_0(x_1^{(0)}, \ldots, x_n^{(0)}) 的某邻域内有定义,

记单位方向向量 l=(cosα1,,cosαn)\vec{l} = (\cos \alpha_1, \ldots, \cos \alpha_n) 满足 cos2α1++cos2αn=1\cos^2 \alpha_1 + \cdots + \cos^2 \alpha_n = 1,若极限

limt0+f(x1(0)+tcosα1,,xn(0)+tcosαn)f(x1(0),,xn(0))t\lim_{t \to 0^+} \frac{f(x_1^{(0)} + t\cos \alpha_1, \ldots, x_n^{(0)} + t\cos \alpha_n) - f(x_1^{(0)}, \ldots, x_n^{(0)})}{t}

存在,则称为 ffP0P_0 沿方向 l\vec{l} 的方向导数,记为 flP0\frac{\partial f}{\partial \vec{l}}\bigg|_{P_0}fl(P0)f_{\vec{l}}(P_0),其中 αi\alpha_i 称为方向角。

下面的定理说明了方向导数与偏导数的关系,我们记二元函数为例

/Theorem/:若 ffP0P_0 点可微,则 ffP0P_0 沿任意方向 l=(cosα,cosβ,cosγ)\vec{l} = (\cos \alpha, \cos \beta, \cos \gamma)(单位向量 cos2α+cos2β+cos2γ=1\cos^2 \alpha + \cos^2 \beta + \cos^2 \gamma = 1)的方向导数均存在,且

flP0=fx(P0)cosα+fy(P0)cosβ+fz(P0)cosγ\frac{\partial f}{\partial \vec{l}}\bigg|_{P_0} = f_x(P_0) \cos \alpha + f_y(P_0) \cos \beta + f_z(P_0) \cos \gamma

/proof/

由可微,f(x0+Δx,y0+Δy,z0+Δz)f(x0,y0,z0)=fx(P0)Δx+fy(P0)Δy+fz(P0)Δz+o(ρ)f(x_0 + \Delta x, y_0 + \Delta y, z_0 + \Delta z) - f(x_0, y_0, z_0) = f_x(P_0) \Delta x + f_y(P_0) \Delta y + f_z(P_0) \Delta z + o(\rho)

其中 ρ=Δx2+Δy2+Δz2\rho = \sqrt{\Delta x^2 + \Delta y^2 + \Delta z^2}

(Δx,Δy,Δz)=t(cosα,cosβ,cosγ)=tl(\Delta x, \Delta y, \Delta z) = t(\cos \alpha, \cos \beta, \cos \gamma) = t \vec{l},则 ρ=t\rho = t

等式两边除以 tt 并取极限 t0+t \to 0^+,即可得到结论

紧接着给出梯度定义:

/Define/

f(x,y,z)f(x, y, z)P0(x0,y0,z0)P_0(x_0, y_0, z_0) 沿任意方向的方向导数均存在,则称向量 (fx(P0),fy(P0),fz(P0))(f_x(P_0), f_y(P_0), f_z(P_0))ffP0P_0 的梯度,记作 f(P0)\nabla f(P_0)f(P0)\nabla f(P_0)

注意:定理(方向导数与偏导数关系)可以写成 fl=f(P0)l=f(P0)lcosθ\frac{\partial f}{\partial \vec{l}} = \nabla f(P_0) \cdot \vec{l} = |\nabla f(P_0)| |\vec{l}| \cos \theta ,从而 f(P0)flf(P0)-|\nabla f(P_0)| \leq \frac{\partial f}{\partial \vec{l}} \leq |\nabla f(P_0)|

l\vec{l}f(P0)\nabla f(P_0) 的方向一致时,方向导数 fl\frac{\partial f}{\partial \vec{l}} 可以取到上界,方向相反时可以取到下界

Q.:若 ffP0P_0 沿任意方向的方向导数都存在,能否推出 ffP0P_0 连续?

反例f(x,y)={0y=x2,(x,y)(0,0)1elsef(x, y) = \begin{cases} 0 & |y| = x^2, (x, y) \neq (0, 0) \\ 1 & \text{else} \end{cases}(0,0)(0, 0) 显然不连续,而 ff(0,0)(0, 0) 沿任意方向的方向导数都存在且为零

Fragment 5 几何应用

· 曲线的切线和法平面

(1). 平面曲线

Q.:平面曲线 F(x,y)=0F(x, y) = 0,求 (x0,y0)(x_0, y_0) 处的切线

直接微分 Fx(x0,y0)dx+Fy(x0,y0)dy=0F_x(x_0, y_0) dx + F_y(x_0, y_0) dy = 0

  1. Fy(x0,y0)0F_y(x_0, y_0) \neq 0,则 y(x0)=Fx(P0)Fy(P0)y'(x_0) = -\frac{F_x(P_0)}{F_y(P_0)}

​ 故切线为 yy0=Fx(P0)Fy(P0)(xx0)y - y_0 = -\frac{F_x(P_0)}{F_y(P_0)}(x - x_0)

  1. Fx(x0,y0)0F_x(x_0, y_0) \neq 0,则 x(y0)=Fy(P0)Fx(P0)x'(y_0) = -\frac{F_y(P_0)}{F_x(P_0)}

​ 故切线为 xx0=Fy(P0)Fx(P0)(yy0)x - x_0 = -\frac{F_y(P_0)}{F_x(P_0)}(y - y_0)

将上面两种情况结合,切线方程为 Fx(P0)(xx0)+Fy(P0)(yy0)=0F_x(P_0)(x - x_0) + F_y(P_0)(y - y_0) = 0

注意:微分 Fx(x0,y0)dx+Fy(x0,y0)dy=0F_x(x_0, y_0) dx + F_y(x_0, y_0) dy = 0 的本质是在局部用线性函数逼近原函数。因此去掉高阶项,即将 dxdx 换为 xx0x - x_0 后,微分式就成为了切线方程。

(2). 空间曲线

Q:当空间曲线由参数方程 L:x=x(t),y=y(t),z=z(t),αtβL: x = x(t), y = y(t), z = z(t), \alpha \leq t \leq \beta 给出,求 P0(x(t0),y(t0),z(t0))P_0(x(t_0), y(t_0), z(t_0)) 处切线和法平面

在曲线上取一点 Q(x(t),y(t),z(t))Q(x(t), y(t), z(t))

则割线 P0QP_0Q 的方向为 P0Q=(x(t)x(t0)tt0,y(t)y(t0)tt0,z(t)z(t0)tt0)\vec{P_0Q} = \left( \frac{x(t) - x(t_0)}{t - t_0}, \frac{y(t) - y(t_0)}{t - t_0}, \frac{z(t) - z(t_0)}{t - t_0} \right)

取极限 tt0t \to t_0,则割线 P0QP_0Q 的方向趋向于 (x(t0),y(t0),z(t0))(x'(t_0), y'(t_0), z'(t_0)),即切线方向

从而切线方程为 xx0x(t0)=yy0y(t0)=zz0z(t0)\frac{x - x_0}{x'(t_0)} = \frac{y - y_0}{y'(t_0)} = \frac{z - z_0}{z'(t_0)}

法平面:由 x(t0)(xx0)+y(t0)(yy0)+z(t0)(zz0)=0x'(t_0)(x - x_0) + y'(t_0)(y - y_0) + z'(t_0)(z - z_0) = 0

注意:微分 dx=x(t0)dtdx = x'(t_0) dt,去掉高阶项 {xx0=x(t0)(tt0)yy0=y(t0)(tt0)zz0=z(t0)(tt0)\begin{cases} x - x_0 = x'(t_0)(t - t_0) \\ y - y_0 = y'(t_0)(t - t_0) \\ z - z_0 = z'(t_0)(t - t_0) \end{cases} 即为切线

Q.:当空间曲线由方程 L:{F(x,y,z)=0G(x,y,z)=0L: \begin{cases} F(x, y, z) = 0 \\ G(x, y, z) = 0 \end{cases} 给出,求 P0(x0,y0,z0)P_0(x_0, y_0, z_0) 处切线

微分 {Fxdx+Fydy+Fzdz=0Gxdx+Gydy+Gzdz=0\begin{cases} F_x dx + F_y dy + F_z dz = 0 \\ G_x dx + G_y dy + G_z dz = 0 \end{cases},去掉高阶项

{Fx(P0)(xx0)+Fy(P0)(yy0)+Fz(P0)(zz0)=0Gx(P0)(xx0)+Gy(P0)(yy0)+Gz(P0)(zz0)=0\begin{cases} F_x(P_0)(x - x_0) + F_y(P_0)(y - y_0) + F_z(P_0)(z - z_0) = 0 \\ G_x(P_0)(x - x_0) + G_y(P_0)(y - y_0) + G_z(P_0)(z - z_0) = 0 \end{cases}

即为切线方程

· 曲面的切平面与法线

:空间曲面 π:F(x,y,z)=0\pi: F(x, y, z) = 0,求 P0(x0,y0,z0)P_0(x_0, y_0, z_0) 处切平面与法线

微分 Fxdx+Fydy+Fzdz=0F_x dx + F_y dy + F_z dz = 0,去掉高阶项

Fx(P0)(xx0)+Fy(P0)(yy0)+Fz(P0)(zz0)=0F_x(P_0)(x - x_0) + F_y(P_0)(y - y_0) + F_z(P_0)(z - z_0) = 0 即为切平面方程

切平面的法向量为 r=(Fx(P0),Fy(P0),Fz(P0))\vec{r} = (F_x(P_0), F_y(P_0), F_z(P_0))

定理:设空间曲面 π:F(x,y,z)=0\pi: F(x, y, z) = 0 中任意一条过 P0(x0,y0,z0)P_0(x_0, y_0, z_0) 的曲线为

L:x=x(t),y=y(t),z=z(t)L: x = x(t), y = y(t), z = z(t),则 LLP0P_0 的切线包含于 π\piP0P_0 的切平面中。

/proof/

t=t0t = t_0 对应 P0(x0,y0,z0)P_0(x_0, y_0, z_0),由于 LL 包含于 π\pi 中,F(x(t),y(t),z(t))=0F(x(t), y(t), z(t)) = 0

求导得 Fx(P0)x(t0)+Fy(P0)y(t0)+Fz(P0)z(t0)=0F_x(P_0) \cdot x'(t_0) + F_y(P_0) \cdot y'(t_0) + F_z(P_0) \cdot z'(t_0) = 0

r=(Fx(P0),Fy(P0),Fz(P0))\vec{r} = (F_x(P_0), F_y(P_0), F_z(P_0))π\piP0P_0 的切平面法向量

r(x(t0),y(t0),z(t0))=0\vec{r} \cdot (x'(t_0), y'(t_0), z'(t_0)) = 0LLP0P_0 的切线方向向量

rr=0\vec{r} \cdot \vec{r} = 0,即 LLP0P_0 的切线与 π\piP0P_0 的切平面法向量垂直,从而定理成立

Fragment 6 极值

先讲讲水管(我一个朋友)的故事

教授:“一元函数驻点的定义是什么”

水管:“导数等于零”

教授:“那二元函数和一元函数的区别是什么(鼓励的语气)”

水管:“有两个未知数”

(最后水管劳斯想出了答案是偏导数存在且都等于 00 ,对面明显松了口气)

当然也说句实在话,让文科生学工科数学分析本身就是个很离谱的事情。

· 泰勒公式

“多元 Taylor 公式本质上没有给出新的内容,就是将多元的函数限制在一个直线上,然后给出一元的 Taylor 公式”

这部分的特点是复杂,但是没有什么新的东西

/Theorem/

DDRn\mathbb{R}^n 的开集, x,yD\vec{x}, \vec{y} \in D ,且线段 xyD\vec{x}\vec{y} \subseteq D ,则对于 fCm(D)f \in C^m(D) 有:

f(y)=f(x)+11!i=1mif(x)(yixi)++1(m1)!i1im1im1i1f(x)(yi1xi1)(yim1xim1)+1m!i1imimi1f(x+θ(yx))(yi1xi1)(yimxim)\begin{align*} f(\vec{y}) &= f(\vec{x}) + \frac{1}{1!} \sum_{i=1}^{m} \partial_i f(\vec{x})(y_i - x_i) + \cdots\\ &+ \frac{1}{(m-1)!} \sum_{i_1} \cdots \sum_{i_{m-1}} \partial_{i_{m-1}} \cdots \partial_{i_1} f(\vec{x})(y_{i_1} - x_{i_1}) \cdots (y_{i_{m-1}} - x_{i_{m-1}})\\ &+ \frac{1}{m!} \sum_{i_1} \cdots \sum_{i_m} \partial_{i_m} \cdots \partial_{i_1} f(\vec{x} + \theta(\vec{y} - \vec{x}))(y_{i_1} - x_{i_1}) \cdots (y_{i_m} - x_{i_m}) \end{align*}

实际使用中,我们用到的版本可能是 m=1m=1 时的公式,也就是多元微分中值定理

/Corollary/

xyD\vec{xy} \subseteq DfC1(D)f \in C^1(D),则 0<θ<1\exists 0 < \theta < 1 使得

f(y)=f(x)+i=1nif(x+θ(yx))(yixi)=f(x)+(1fnf)x+θ(yx)(y1x1ynxn)\begin{align*} f(\vec{y}) &= f(\vec{x}) + \sum_{i=1}^{n} \partial_i f(\vec{x} + \theta(\vec{y} - \vec{x}))(y_i - x_i) &= f(\vec{x}) + \left( \partial_1 f \cdots \partial_n f \right) \bigg|_{\vec{x} + \theta(\vec{y} - \vec{x})} \begin{pmatrix} y_1 - x_1 \\ \vdots \\ y_n - x_n \end{pmatrix} \end{align*}

回忆 Jacobian:

Jf(u)=(fx1(u)fxn(u))1×nJ_f(\vec{u}) = \begin{pmatrix} \frac{\partial f}{\partial x_1}(\vec{u}) & \cdots & \frac{\partial f}{\partial x_n}(\vec{u}) \end{pmatrix}_{1 \times n}

因此喜欢线性代数的同学可以把微分中值写作

f(y)=f(x)+Jf(x+θ(yx))(yx)f(\vec{y}) = f(\vec{x}) + J_f(\vec{x} + \theta(\vec{y} - \vec{x}))(\vec{y} - \vec{x})

与之前所说的 ff 线性近似项 f\longleftrightarrow f 的微分(其表示矩阵为 JfJ_f)相互呼应。

ff 可微:f(y)=f(x)+Jf(x)(yx)+o(yx)f(y) = f(x) + J_f(x)(y - x) + o(\|y - x\|)

微分中值:f(y)=f(x)+Jf(x+θ(yx))(yx)f(y) = f(x) + J_f(x + \theta(y - x))(y - x)

(感觉我们应该考不到这么离谱的地步吧)

· 无条件极值

以二元函数为例,若 P0(x0,y0)P_0(x_0, y_0)f(x,y)f(x, y) 的极值点

x0x_0 是一元函数 f(x,y0)f(x, y_0) 的极值点,y0y_0 是一元函数 f(x0,y)f(x_0, y) 的极值点,从而有定理

定理1(极值必要条件):若 ffP0P_0 处存在对各变元的偏导数,且 P0P_0 是极值点,则 ffP0P_0 处对各变元的偏导数均为零,这样的点称为稳定点。

注意:不是充分条件,例如 z=x2+y2z = \sqrt{x^2 + y^2}(0,0)(0, 0) 取极小值,但偏导不存在。

Q.:设 y=f(x,y)y = f(x, y)P0(x0,y0)P_0(x_0, y_0) 是稳定点,怎么判断 P0(x0,y0)P_0(x_0, y_0) 是否是极值点?

考虑 ff 的二阶泰勒公式(稳定点,线性项为零)

f(x,y)=f(x0,y0)+12(Δx,Δy)Hf(x0,y0)(ΔxΔy)+o(ρ2)f(x, y) = f(x_0, y_0) + \frac{1}{2} (\Delta x, \Delta y) H_f(x_0, y_0) \begin{pmatrix} \Delta x \\ \Delta y \end{pmatrix} + o(\rho^2)

直观上,若黑塞矩阵 Hf=[fxxfxyfxyfyy]H_f = \begin{bmatrix} f_{xx} & f_{xy} \\ f_{xy} & f_{yy} \end{bmatrix}(x0,y0)(x_0, y_0) 处正定时

ff(x0,y0)(x_0, y_0) 局部有 12(Δx,Δy)Hf(x0,y0)[ΔxΔy]+o(ρ2)0\frac{1}{2} (\Delta x, \Delta y) H_f(x_0, y_0) \begin{bmatrix} \Delta x \\ \Delta y \end{bmatrix} + o(\rho^2) \geq 0

从而 f(x,y)f(x0,y0)f(x, y) \geq f(x_0, y_0)P0(x0,y0)P_0(x_0, y_0) 为极小值点

定理2:设 f(x1,,xn)f(x_1, \ldots, x_n)P0(x1(0),,xn(0))P_0(x_1^{(0)}, \ldots, x_n^{(0)}) 的某邻域 U(P0)U(P_0) 上具有二阶连续偏导数,且 P0P_0 是稳定点,则

  1. Hf(P0)H_f(P_0) 正定,则 P0P_0 是极小值点;
  2. Hf(P0)H_f(P_0) 负定,则 P0P_0 是极大值点;
  3. Hf(P0)H_f(P_0) 不定,则 P0P_0 不是极值点;
  4. Hf(P0)H_f(P_0) 半正定或半负定,则不能确定 P0P_0 是否为极值点。

鉴于线代还没讲到正定矩阵,先主要讨论二元函数的情况

n=2n = 2 时,即 f(x,y)f(x, y) 为二元函数时,有如下判别法:

A=fxx(P0)B=fxy(P0)C=fyy(P0)A=f_{xx}(P_0)\quad \quad B=f_{xy}(P_0)\quad \quad C=f_{yy}(P_0)

  1. A>0A > 0(ACB2)(P0)>0(AC - B^2)(P_0) > 0,则 P0P_0 是极小值点;
  2. A<0A < 0(ACB2)(P0)>0(AC - B^2)(P_0) > 0,则 P0P_0 是极大值点;
  3. (ACB2)(P0)<0(AC - B^2)(P_0) < 0,则 P0P_0 不是极值点;
  4. (ACB2)(P0)=0(AC - B^2)(P_0) = 0,则不能确定 P0P_0 是否为极值点。

· 最值

由有界闭集上连续函数的性质,若 ff 在有界闭区域 DD 上连续,则 ffDD 取到最值

若最值点是 DD 的内点则必是极值点,因此 ff 的可能最值点是 ff 的极值点和 DD 的边界点

步骤一:研究边界 D\partial Dff 的取值,求出 MDM_{\partial D}mDm_{\partial D}

步骤二:求出所有稳定点和不可导点(通常有限个)P1,,PnP_1, \ldots, P_n

步骤三M=max{MD,f(P1),,f(Pn)}M = \max\{M_{\partial D}, f(P_1), \ldots, f(P_n)\}

DD 为无界区域,用有界闭区域逼近无界区域

命题:若 f(x,y)f(x, y)R2\mathbb{R}^2 连续,且 limρ+f(x,y)=+\lim_{\rho \to +\infty} f(x, y) = +\inftyR=x2+y2R = \sqrt{x^2 + y^2},则 f(x,y)f(x, y) 必有最小值。

M=f(0,0)M = f(0, 0),则 R0>0\exists R_0 > 0,使得 RR0\forall R \geq R_0

f(x,y)f(0,0)f(x, y) \geq f(0, 0)x2+y2>R2x^2 + y^2 > R^2,特别地,在 x2+y2>R02x^2 + y^2 > R_0^2 成立

ff 在有界闭区域 DR0={x2+y2R0}D_{R_0} = \{x^2 + y^2 \leq R_0\} 上连续,故必有最小值 mm

(0,0)DR0(0, 0) \in D_{R_0},因此 mf(0,0)m \leq f(0, 0),从而 mmffR2\mathbb{R}^2 上的最小值

下面我们列举一些二元函数与一元函数不同的性质

问题1:是否存在二元连续函数 f(x,y)f(x, y) 有无穷个极小值点,但无极大值点

E.G.:考虑 f(x,y)=x2f(x, y) = x^2,则 (0,y)(0, y) 都是极小值点

问题2:若二元连续函数 f(x,y)f(x, y) 有唯一的极小值点,是否一定是最小值点?

反例f(x,y)=x2+y2(1+x)2f(x, y) = x^2 + y^2(1 + x)^2 在全平面连续

稳定点 fx=2x+3y2(1+x)2=0,fy=2y(1+x)3=0f_x = 2x + 3y^2(1 + x)^2 = 0, f_y = 2y(1 + x)^3 = 0,则 (x,y)=(0,0)(x, y) = (0, 0)

用黑塞矩阵容易判别 (0,0)(0, 0) 为极小值点,然而

limyf(2,y)=limy4y2=\lim_{y \to \infty} f(-2, y) = \lim_{y \to \infty} 4 - y^2 = -\infty

从而 (0,0)(0, 0) 不是最小值点

问题3:任给方向 l=(α,β)\vec{l} = (\alpha, \beta)f(α,β)f(\alpha, \beta) 作为 ff 的一元函数有极小值点 α=0\alpha = 0,是否 (0,0)(0, 0)f(x,y)f(x, y) 的极小值点?

反例f(x,y)=(yx2)(y2x2)f(x, y) = (y - x^2)(y - 2x^2)

· 条件极值

前面我们考虑了函数 ff 在某区域 DD 上的极值问题

但实际问题中,函数 ff 的自变量往往受到其他条件的约束,称为条件极值问题

满足约束条件的极值点称为条件极值点

条件极值问题的一般形式为,求目标函数 f=(x1,x2,xn)f = (x_1, x_2 \ldots, x_n)

在约束条件 gi(x1,x2,xn)=0,i=1,2,,m(m<n)g_i(x_1, x_2 \ldots, x_n) = 0, i = 1, 2, \ldots, m (m < n) 下的条件极值

m=3m = 3n=2n = 2 时,目标函数 f(x,y,z)f(x, y, z),约束条件

{g1(x,y,z)=0g2(x,y,z)=0\begin{cases} g_1(x, y, z) = 0 \\ g_2(x, y, z) = 0 \end{cases}

(x0,y0,z0)(x_0, y_0, z_0) 是条件极值点,则首先要满足约束条件,即

{g1(x0,y0,z0)=0g2(x0,y0,z0)=0\begin{cases} g_1(x_0, y_0, z_0) = 0 \\ g_2(x_0, y_0, z_0) = 0 \end{cases}

这时候我们可以用 Language 乘数法(证明过程交给正在学习数学分析或高等微积分的同学)

上面的讨论说明:若 (x0,y0,z0)(x_0, y_0, z_0) 是条件极值点,且满足一定条件

则存在唯一的 λ1,λ2\lambda_1, \lambda_2 使得方程组

{fx(x0,y0,z0)+λ1g1x(x0,y0,z0)+λ2g2x(x0,y0,z0)=0fy(x0,y0,z0)+λ1g1y(x0,y0,z0)+λ2g2y(x0,y0,z0)=0fz(x0,y0,z0)+λ1g1z(x0,y0,z0)+λ2g2z(x0,y0,z0)=0g1(x0,y0,z0)=0g2(x0,y0,z0)=0\begin{cases} f_x(x_0, y_0, z_0) + \lambda_1 g_{1x}(x_0, y_0, z_0) + \lambda_2 g_{2x}(x_0, y_0, z_0) = 0 \\ f_y(x_0, y_0, z_0) + \lambda_1 g_{1y}(x_0, y_0, z_0) + \lambda_2 g_{2y}(x_0, y_0, z_0) = 0 \\ f_z(x_0, y_0, z_0) + \lambda_1 g_{1z}(x_0, y_0, z_0) + \lambda_2 g_{2z}(x_0, y_0, z_0) = 0 \\ g_1(x_0, y_0, z_0) = 0 \\ g_2(x_0, y_0, z_0) = 0 \end{cases}

引入 Lagrange 函数 L(x,y,z)=f(x,y,z)+λ1g1(x,y,z)+λ2g2(x,y,z)L(x, y, z) = f(x, y, z) + \lambda_1 g_1(x, y, z) + \lambda_2 g_2(x, y, z)

容易验证,方程组转化为

{Lx=Ly=Lz=0g1(x0,y0,z0)=0g2(x0,y0,z0)=0\begin{cases} L_x = L_y = L_z = 0 \\ g_1(x_0, y_0, z_0) = 0 \\ g_2(x_0, y_0, z_0) = 0 \end{cases}

以上讨论可以推广到任意的 m<nm < n 的情形

Total 总结

偏导数连续 \Rightarrow 可微分 \Rightarrow 偏导数存在+函数连续

由于多元函数方向导数不同书目定义不同,这里暂不讨论