Chapter 8 多元函数微分
∫ b i r t h d e a t h s t u d y d t i m e = l i f e \int^{death}_{birth}study\ \text{d}\ time=life
∫ bi r t h d e a t h s t u d y d t im e = l i f e
Fragment 1 多元函数极限
· 平面点集
平面上的点 P P P 可以用一有序实数对 ( x , y ) (x, y) ( x , y ) 唯一表示
设 P 1 ( x 1 , y 1 ) P_1(x_1, y_1) P 1 ( x 1 , y 1 ) , P 2 ( x 2 , y 2 ) P_2(x_2, y_2) P 2 ( x 2 , y 2 ) 的距离 d ( P 1 , P 2 ) = ( x 1 − x 2 ) 2 + ( y 1 − y 2 ) 2 d(P_1, P_2) = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2} d ( P 1 , P 2 ) = ( x 1 − x 2 ) 2 + ( y 1 − y 2 ) 2
这样的定义满足如下的极限性质
正性: $d(P_1, P_2) \geq 0 $ ,且仅当 $ P_1 = P_2$ 等号成立
三角不等式: d ( P 1 , P 2 ) ≤ d ( P 1 , P 3 ) + d ( P 3 , P 2 ) d(P_1, P_2) \leq d(P_1, P_3) + d(P_3, P_2) d ( P 1 , P 2 ) ≤ d ( P 1 , P 3 ) + d ( P 3 , P 2 )
平面上满足某条件的点的集合称为平面点集。记作 E = { P ∣ P E = \{ P \mid P E = { P ∣ P 满足某条件 } \} }
平面点列 { P n } \{ P_n \} { P n } 是特殊的平面点集:
(1). 邻域
设 P n P_n P n 与 δ \delta δ 圆的交为 { P ∣ d ( P , P n ) < δ } \{ P \mid d(P, P_n) < \delta \} { P ∣ d ( P , P n ) < δ } ,记作 N ( P n , δ ) N(P_n, \delta) N ( P n , δ )
定义 P 0 P_0 P 0 为平面点 α \alpha α 的极限为 { P ∣ 0 < d ( P , P n ) < δ } \{ P \mid 0 < d(P, P_n) < \delta \} { P ∣ 0 < d ( P , P n ) < δ } ,记作 N α ( P n , δ ) N_\alpha(P_n, \delta) N α ( P n , δ )
还有一种极限称为无穷极限,即以 P 0 P_0 P 0 为中心,以 δ \delta δ 为边长的方形区域,表示为平面极限
由于任一平面极限都可以包含于某一方形极限,反之亦然,所以极限与方形极限等价不加以区分
(2). 平面点集 E E E 中的点 P 0 P_0 P 0 的分类
第一种分类方式:
内点: ∃ δ > 0 \exists \delta > 0 ∃ δ > 0 , N ( P 0 , δ ) ∩ E = ∅ N(P_0, \delta) \cap E = \varnothing N ( P 0 , δ ) ∩ E = ∅
边界点: ∃ δ > 0 \exists \delta > 0 ∃ δ > 0 , N ( P 0 , δ ) ∩ E ≠ ∅ N(P_0, \delta) \cap E \neq \varnothing N ( P 0 , δ ) ∩ E = ∅ 且 N ( P 0 , δ ) ∩ E ≠ ∅ N(P_0, \delta) \cap E \neq \varnothing N ( P 0 , δ ) ∩ E = ∅
第二种分类方式:
聚点:定义同上
孤立点: $\exists \delta > 0 $ , $ N(P_0, \delta) \cap E = { P_0 }$
内点是极限点,边界点是极限点或孤立点;孤立点是极限点,聚点是内点或边界点
内点和聚点称为 E E E :聚点全体记作 F F F 又称为闭包,边界点全体记作 ∂ E \partial E ∂ E
命题1:以下三个结论为 P 0 P_0 P 0 为极限点的等价描述:
∀ δ > 0 \forall \delta > 0 ∀ δ > 0 , N ( P 0 , δ ) ∩ E ≠ ∅ N(P_0, \delta) \cap E \neq \varnothing N ( P 0 , δ ) ∩ E = ∅
∀ δ > 0 \forall \delta > 0 ∀ δ > 0 , N ( P 0 , δ ) ∩ E N(P_0, \delta) \cap E N ( P 0 , δ ) ∩ E 是无穷集
∀ δ > 0 \forall \delta > 0 ∀ δ > 0 , N ( P 0 , δ ) ∩ E N(P_0, \delta) \cap E N ( P 0 , δ ) ∩ E 至少有一个极限点
PS:内点和聚点是极限点,但极限点不一定是内点或聚点,例如分外的极限点
(3) 平面点集 E E E 的分类
第一种分类方式:
开集: E ⊂ E ∗ E \subset E^* E ⊂ E ∗
闭集: E ∗ ⊂ E E^* \subset E E ∗ ⊂ E
边界: F ⊂ E F \subset E F ⊂ E
非开闭性: E E E 成开集或闭集但不同时是
第二种分类方式:
有界集: ∃ M > 0 \exists M > 0 ∃ M > 0 , E ⊂ N ( O , M ) E \subset N(O, M) E ⊂ N ( O , M ) ,其中 O ( 0 , 0 ) O(0, 0) O ( 0 , 0 ) 为坐标原点
无界集: ∀ M > 0 \forall M > 0 ∀ M > 0 , ∃ P 0 ∈ E \exists P_0 \in E ∃ P 0 ∈ E , P 0 ∉ N ( O , M ) P_0 \notin N(O, M) P 0 ∈ / N ( O , M )
定义极限的值域为 d ( P 1 , P 2 ) = sup P 1 , P 2 ∈ E d ( P 1 , P 2 ) d(P_1, P_2) = \sup_{P_1, P_2 \in E} d(P_1, P_2) d ( P 1 , P 2 ) = sup P 1 , P 2 ∈ E d ( P 1 , P 2 ) 则 E E E 有界当且仅当 d ( E ) d(E) d ( E ) 为有限值
平面点集 { P 1 ( x 1 , y 1 ) } \{ P_1(x_1, y_1) \} { P 1 ( x 1 , y 1 )} 有界当且仅当 { x n } \{ x_n \} { x n } , { y n } \{ y_n \} { y n } 均有限
命题2:设 F F F 是闭集, G G G 是开集,则 F ∖ G F∖G F ∖ G 是闭集, G ∖ F G∖F G ∖ F 是开集.
(4) 区域与闭区域
若 E E E 中的点可以用有限条折线相互联结为区域集
连续的开集称为区域(开区域),开区域和闭集的边界点组成的区域
PS:闭区域是闭集的补集,但闭集的补集不一定是闭区域,例如分外的闭区域
· 二元函数极限
从 R 2 \mathbb{R}^2 R 2 到 R \mathbb{R} R 的映射是二元函数
/Define/
设平面点集 D ⊂ R 2 D \subset \mathbb{R}^2 D ⊂ R 2 ,若按照某种对应法则 f f f ,D D D 中每一点 P ( x , y ) P(x, y) P ( x , y ) 都有唯一确定的 z ∈ R z \in \mathbb{R} z ∈ R 与之对应,则称 f f f 为定义在 D D D 上的二元函数,称 D D D 为 f f f 的定义域,P ∈ D P \in D P ∈ D 所对应的 z z z 为 f f f 在点 P P P 的函数值,记作 z = f ( P ) z = f(P) z = f ( P ) 或 z = f ( x , y ) z = f(x, y) z = f ( x , y ) ,全体函数值的集合为 f f f 的值域,记作 f ( D ) ⊂ R f(D) \subset \mathbb{R} f ( D ) ⊂ R 。
在三维欧式空间中 S = { ( x , y , z ) ∣ ( x , y ) ∈ D , z = f ( x , y ) } S = \{(x, y, z) | (x, y) \in D, z = f(x, y)\} S = {( x , y , z ) ∣ ( x , y ) ∈ D , z = f ( x , y )} 称为二元函数 f f f 的图像。
/Define/
定义 :设 f f f 为定义在 D ⊂ R 2 D \subset \mathbb{R}^2 D ⊂ R 2 上的二元函数,P 0 P_0 P 0 为 D D D 的一个聚点,A A A 是一个确定的实数,若 ∀ ε > 0 \forall \varepsilon > 0 ∀ ε > 0 ,∃ δ > 0 \exists \delta > 0 ∃ δ > 0 ,∀ p ∈ ( P 0 , δ ) ∩ D \forall p \in (P_0, \delta) \cap D ∀ p ∈ ( P 0 , δ ) ∩ D 有 ∣ f ( P ) − A ∣ < ε |f(P) - A| < \varepsilon ∣ f ( P ) − A ∣ < ε ,则称 A A A 为 f f f 在 D D D 上当 P → P 0 P \to P_0 P → P 0 时的极限,记作
lim ( x , y ) → ( x 0 , y 0 ) f ( P ) = A lim x → x 0 y → y 0 f ( x , y ) = A lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) \lim_{(x, y) \to (x_0, y_0)} f(P) = A\quad \quad \lim_{\substack{x \to x_0 \\ y \to y_0}} f(x, y) = A\quad \quad\lim_{(x, y) \to (x_0, y_0)} f(x, y)
( x , y ) → ( x 0 , y 0 ) lim f ( P ) = A x → x 0 y → y 0 lim f ( x , y ) = A ( x , y ) → ( x 0 , y 0 ) lim f ( x , y )
等价描述 :∀ ε > 0 \forall \varepsilon > 0 ∀ ε > 0 ,∃ δ > 0 \exists \delta > 0 ∃ δ > 0 ,∀ ∣ x − x 0 ∣ < δ \forall |x - x_0| < \delta ∀∣ x − x 0 ∣ < δ ,∣ y − y 0 ∣ < δ |y - y_0| < \delta ∣ y − y 0 ∣ < δ 且 ( x , y ) ≠ ( x 0 , y 0 ) (x, y) \neq (x_0, y_0) ( x , y ) = ( x 0 , y 0 ) 有 ∣ f ( x , y ) − A ∣ < ε |f(x, y) - A| < \varepsilon ∣ f ( x , y ) − A ∣ < ε 。
定理(海涅定理) :设 f f f 为定义在 D ⊂ R 2 D \subset \mathbb{R}^2 D ⊂ R 2 上的二元函数,P 0 P_0 P 0 为 D D D 的一个聚点,则 lim P → P 0 f ( P ) = A \lim_{P \to P_0} f(P) = A lim P → P 0 f ( P ) = A 的充分必要条件是对 D D D 中任意满足 P n ≠ P 0 P_n \neq P_0 P n = P 0 且 P n → P 0 P_n \to P_0 P n → P 0 ,n → ∞ n \to \infty n → ∞ 的点列 { P n } \{P_n\} { P n } 都有 lim n → ∞ f ( P n ) = A \lim_{n \to \infty} f(P_n) = A lim n → ∞ f ( P n ) = A 。
PS :用于证明极限不存在
若存在 { P n } : P n → P 0 \{P_n\} : P_n \to P_0 { P n } : P n → P 0 但 lim n → ∞ f ( P n ) \lim_{n \to \infty} f(P_n) lim n → ∞ f ( P n ) 不存在
若存在 { P n } : P n → P 1 \{P_n\} : P_n \to P_1 { P n } : P n → P 1 ,{ P n ′ } : P n ′ → P 2 \{P_n'\} : P_n' \to P_2 { P n ′ } : P n ′ → P 2 但 lim n → ∞ f ( P n ) ≠ lim n → ∞ f ( P n ′ ) \lim_{n \to \infty} f(P_n) \neq \lim_{n \to \infty} f(P_n') lim n → ∞ f ( P n ) = lim n → ∞ f ( P n ′ ) ,则 lim P → P 0 f ( P ) \lim_{P \to P_0} f(P) lim P → P 0 f ( P ) 不存在
注意 :逆命题不成立,即即使 lim x → 0 f ( x , k x ) ≡ A \lim_{x \to 0} f(x, kx) \equiv A lim x → 0 f ( x , k x ) ≡ A 也不能说明 lim ( x , y ) → ( 0 , 0 ) f ( x , y ) = A \lim_{(x, y) \to (0, 0)} f(x, y) = A lim ( x , y ) → ( 0 , 0 ) f ( x , y ) = A
前面讨论的 lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) \lim_{(x, y) \to (x_0, y_0)} f(x, y) lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) 是两个自变量以任何路径靠近 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) ,称为重极限
定义 :设 f f f 为定义在 D ⊂ R 2 D \subset \mathbb{R}^2 D ⊂ R 2 上的二元函数,D D D 在 x x x 轴 y y y 轴上的投影分别为 X , Y X, Y X , Y ,设 x 0 , y 0 x_0, y_0 x 0 , y 0 分别是 X , Y X, Y X , Y 的聚点。若对任意固定 y → y 0 y \to y_0 y → y 0 y → Y y \to Y y → Y 存在极限 lim x → x 0 f ( x , y ) \lim_{x \to x_0} f(x, y) lim x → x 0 f ( x , y ) (一般与 y y y 有关,是 y y y 的函数),若进一步还存在极限 lim y → y 0 lim x → x 0 f ( x , y ) = A \lim_{y \to y_0} \lim_{x \to x_0} f(x, y) = A lim y → y 0 lim x → x 0 f ( x , y ) = A ,称为 f ( x , y ) f(x, y) f ( x , y ) 先对 x x x 后对 y y y 的累次极限,记作 A 21 = lim x → x 0 lim y → y 0 f ( x , y ) A_{21} = \lim_{x \to x_0} \lim_{y \to y_0} f(x, y) A 21 = lim x → x 0 lim y → y 0 f ( x , y ) ,类似地还有 f ( x , y ) f(x, y) f ( x , y ) 先对 y → y 0 y \to y_0 y → y 0 的累次极限 A 12 = lim y → y 0 lim x → x 0 f ( x , y ) A_{12} = \lim_{y \to y_0} \lim_{x \to x_0} f(x, y) A 12 = lim y → y 0 lim x → x 0 f ( x , y ) ,重极限记作 A = lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) A = \lim_{(x, y) \to (x_0, y_0)} f(x, y) A = lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) 。
注意 :累次极限与重极限的存在性没有必然的蕴含关系
定理 :若重极限 lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) = A \lim_{(x, y) \to (x_0, y_0)} f(x, y) = A lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) = A (有限或无限),且当 y ≠ y 0 y \neq y_0 y = y 0 时 lim x → x 0 f ( x , y ) = φ ( y ) \lim_{x \to x_0} f(x, y) = \varphi(y) lim x → x 0 f ( x , y ) = φ ( y ) 存在,则有
lim y → y 0 lim x → x 0 f ( x , y ) = lim x → x 0 φ ( y ) = A \lim_{y \to y_0} \lim_{x \to x_0} f(x, y) = \lim_{x \to x_0} \varphi(y) = A
y → y 0 lim x → x 0 lim f ( x , y ) = x → x 0 lim φ ( y ) = A
/proof/
当 A A A 有限时,∀ ε > 0 \forall \varepsilon > 0 ∀ ε > 0 ,∃ δ > 0 \exists \delta > 0 ∃ δ > 0 ,∀ ∣ x − x 0 ∣ < δ \forall |x - x_0| < \delta ∀∣ x − x 0 ∣ < δ ,∣ y − y 0 ∣ < δ |y - y_0| < \delta ∣ y − y 0 ∣ < δ 且 ( x , y ) ≠ ( x 0 , y 0 ) (x, y) \neq (x_0, y_0) ( x , y ) = ( x 0 , y 0 ) 时,有 ∣ f ( x , y ) − A ∣ < ε |f(x, y) - A| < \varepsilon ∣ f ( x , y ) − A ∣ < ε
对固定的 y ≠ y 0 y \neq y_0 y = y 0 ,由于 lim x → x 0 f ( x , y ) = φ ( y ) \lim_{x \to x_0} f(x, y) = \varphi(y) lim x → x 0 f ( x , y ) = φ ( y ) ,则上式取极限 x → x 0 x \to x_0 x → x 0
知当 ∣ y − y 0 ∣ < δ |y - y_0| < \delta ∣ y − y 0 ∣ < δ 时,有 ∣ φ ( y ) − A ∣ < ε |\varphi(y) - A| < \varepsilon ∣ φ ( y ) − A ∣ < ε ,A A A 无限的情况同理
注意 :
若重极限与两个累次极限都存在,则三者必相等
若两个累次极限存在但不相等,则重极限不存在
· 二元函数连续性
/Define/
设 f f f 为定义在 D ⊂ R 2 D \subset \mathbb{R}^2 D ⊂ R 2 上的二元函数,P 0 ∈ D P_0 \in D P 0 ∈ D (聚点或孤立点)若 ∀ ε > 0 \forall \varepsilon > 0 ∀ ε > 0 ,∃ δ > 0 \exists \delta > 0 ∃ δ > 0 ,∀ P ∈ N ( P 0 , δ ) ∩ D \forall P \in N(P_0, \delta) \cap D ∀ P ∈ N ( P 0 , δ ) ∩ D 有 ∣ f ( P ) − f ( P 0 ) ∣ < ε |f(P) - f(P_0)| < \varepsilon ∣ f ( P ) − f ( P 0 ) ∣ < ε ,则称 f f f 关于 D D D 在 P 0 P_0 P 0 连续,等价描述为 lim P → P 0 f ( P ) = f ( P 0 ) \lim_{P \to P_0} f(P) = f(P_0) lim P → P 0 f ( P ) = f ( P 0 ) 。若 P P P 上下任何点都连续,称 f f f 为 D D D 上的连续函数。
若 P 0 P_0 P 0 是 D D D 的孤立点,则 P 0 P_0 P 0 必是 f f f 关于 D D D 的连续点
若 lim P → P 0 f ( P ) \lim_{P \to P_0} f(P) lim P → P 0 f ( P ) 存在但不等于 f ( P 0 ) f(P_0) f ( P 0 ) ,称 P 0 P_0 P 0 为 f f f 的可去间断点
定理(复合函数的连续性) :设 f ( x , y ) f(x, y) f ( x , y ) 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 连续,而 x = φ ( s , t ) x = \varphi(s, t) x = φ ( s , t ) ,y = ψ ( s , t ) y = \psi(s, t) y = ψ ( s , t ) 在 ( s 0 , t 0 ) (s_0, t_0) ( s 0 , t 0 ) 连续,x 0 = φ ( s 0 , t 0 ) x_0 = \varphi(s_0, t_0) x 0 = φ ( s 0 , t 0 ) ,y 0 = ψ ( s 0 , t 0 ) y_0 = \psi(s_0, t_0) y 0 = ψ ( s 0 , t 0 ) ,则复合函数 g ( s , t ) = f ( φ ( s , t ) , ψ ( s , t ) ) g(s, t) = f(\varphi(s, t), \psi(s, t)) g ( s , t ) = f ( φ ( s , t ) , ψ ( s , t )) 在 ( s 0 , t 0 ) (s_0, t_0) ( s 0 , t 0 ) 连续。
Fragment 2 偏导数 全微分
· 基础概念
若将二元函数中的一个变量固定,则二元函数就退化为了一元函数,此时我们可以考虑微分。
/Define/
设 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 的某邻域上有定义,若极限
lim Δ x → 0 f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) Δ x \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x, y_0) - f(x_0, y_0)}{\Delta x}
Δ x → 0 lim Δ x f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 )
存在,称为 z z z 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 关于 x x x 的偏导数,记为
z x ( x 0 , y 0 ) or f x ( x 0 , y 0 ) or ∂ z ∂ x ∣ ( x 0 , y 0 ) or ∂ f ∂ x ∣ ( x 0 , y 0 ) z_x(x_0, y_0) \text{ or } f_x(x_0, y_0) \text{ or } \frac{\partial z}{\partial x} \bigg|_{(x_0, y_0)} \text{ or } \frac{\partial f}{\partial x} \bigg|_{(x_0, y_0)}
z x ( x 0 , y 0 ) or f x ( x 0 , y 0 ) or ∂ x ∂ z ( x 0 , y 0 ) or ∂ x ∂ f ( x 0 , y 0 )
若 z z z 在 E E E 上每一点都可导,则称 z z z 在 E E E 上可导, f x ( x , y ) f_x(x, y) f x ( x , y ) 与 f y ( x , y ) f_y(x, y) f y ( x , y ) 称为偏导函数。
若 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 可导,是否一定连续?
反例: f ( x , y ) = { 1 x y ≠ 0 0 x y = 0 f(x, y) = \begin{cases}
1 & xy \neq 0 \\
0 & xy = 0
\end{cases} f ( x , y ) = { 1 0 x y = 0 x y = 0 在 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 处可导但不连续,可导不一定连续。
我们已经在二元函数定义了偏导数概念
回顾一元微分:如果 y = f ( x ) y = f(x) y = f ( x ) 在 x 0 x_0 x 0 点某邻域上有定义,且
Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y = f(x_0 + \Delta x) - f(x_0)
Δ y = f ( x 0 + Δ x ) − f ( x 0 )
能写成 A ( x ) Δ x + o ( Δ x ) ( Δ x → 0 ) A(x) \Delta x + o(\Delta x) (\Delta x \to 0) A ( x ) Δ x + o ( Δ x ) ( Δ x → 0 ) 的形式,则称 y = f ( x ) y = f(x) y = f ( x ) 在 x 0 x_0 x 0 点可微, A Δ x A \Delta x A Δ x 称为 y y y 在 x 0 x_0 x 0 点的微分,记为 d y = A d x dy = A dx d y = A d x 。
我们可以将其推广到二元函数上
/Define/
设 $ z = f(x, y) $ 在 $ (x_0, y_0) $ 点某邻域上有定义,且
Δ z = f ( x 0 + Δ x , y 0 + Δ y ) − f ( x 0 , y 0 ) \Delta z = f(x_0 + \Delta x, y_0 + \Delta y) - f(x_0, y_0)
Δ z = f ( x 0 + Δ x , y 0 + Δ y ) − f ( x 0 , y 0 )
可以表示成 A Δ x + B Δ y + o ( ρ ) A \Delta x + B \Delta y + o(\rho) A Δ x + B Δ y + o ( ρ ) ,
ρ = Δ x 2 + Δ y 2 \rho = \sqrt{\Delta x^2 + \Delta y^2}
ρ = Δ x 2 + Δ y 2
的形式则称 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 点可微。 A Δ x + B Δ y A \Delta x + B \Delta y A Δ x + B Δ y 称为 z z z 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 点的微分,记为 d z ∣ ( x 0 , y 0 ) = A d x + B d y dz|_{(x_0, y_0)} = A dx + B dy d z ∣ ( x 0 , y 0 ) = A d x + B d y
不同于偏导数,全微分蕴含了函数某点处所有方向的信息,因此可微的条件比可导更强。
定理1:若 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 可微,则 z z z 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 点连续
/proof/
lim ( x , y ) → ( x 0 , y 0 ) f ( x , y ) = lim Δ x → 0 f ( x 0 + Δ x , y 0 + Δ y ) = lim Δ x → 0 f ( x 0 , y 0 ) + A Δ x + B Δ y + o ( ρ ) = f ( x 0 , y 0 ) ( Δ y → 0 ) \begin{align*}
\lim_{(x, y) \to (x_0, y_0)} f(x, y) &= \lim_{\Delta x \to 0} f(x_0 + \Delta x, y_0 + \Delta y)\\
&= \lim_{\Delta x \to 0} f(x_0, y_0) + A \Delta x + B \Delta y + o(\rho) \\
&= f(x_0, y_0)
\quad(\Delta y \to 0)
\end{align*}
( x , y ) → ( x 0 , y 0 ) lim f ( x , y ) = Δ x → 0 lim f ( x 0 + Δ x , y 0 + Δ y ) = Δ x → 0 lim f ( x 0 , y 0 ) + A Δ x + B Δ y + o ( ρ ) = f ( x 0 , y 0 ) ( Δ y → 0 )
下面的定理说明了全微分与偏导数的关系。
定理2:若 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 可微 d z ( x , y ) = A d x + B d y dz(x, y) = A dx + B dy d z ( x , y ) = A d x + B d y ,则 A = f x ( x , y ) A = f_x(x, y) A = f x ( x , y ) , B = f y ( x , y ) B = f_y(x, y) B = f y ( x , y ) 。
/proof/
固定 y y y ,即 Δ y = 0 \Delta y = 0 Δ y = 0 ,则 ρ = ∣ Δ x ∣ \rho = |\Delta x| ρ = ∣Δ x ∣
f ( x + Δ x , y ) − f ( x , y ) = A Δ x + o ( ∣ Δ x ∣ ) f(x + \Delta x, y) - f(x, y) = A \Delta x + o(|\Delta x|)
f ( x + Δ x , y ) − f ( x , y ) = A Δ x + o ( ∣Δ x ∣ )
⇒ f ( x + Δ x , y ) − f ( x , y ) Δ x = A + o ( ∣ Δ x ∣ ) Δ x \Rightarrow \frac{f(x + \Delta x, y) - f(x, y)}{\Delta x} = A + \frac{o(|\Delta x|)}{\Delta x}
⇒ Δ x f ( x + Δ x , y ) − f ( x , y ) = A + Δ x o ( ∣Δ x ∣ )
上式取极限 Δ x → 0 \Delta x \to 0 Δ x → 0 ,则得到 f x ( x , y ) = A f_x(x, y) = A f x ( x , y ) = A
注意:
二元 d z = f x d x + f y d y dz = f_x dx + f_y dy d z = f x d x + f y d y ,三元 d u = f x d x + f y d y + f z d z du = f_x dx + f_y dy + f_z dz d u = f x d x + f y d y + f z d z
可微一定连续,可微一定可导
二元函数全微分与一元函数微分一样具有几何意义
(1). 一元函数 y = f ( x ) y = f(x) y = f ( x )
在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 处的微分 d y = f ′ ( x 0 ) d x dy = f'(x_0) dx d y = f ′ ( x 0 ) d x
在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 处的切线 y − y 0 = f ′ ( x 0 ) ( x − x 0 ) y - y_0 = f'(x_0)(x - x_0) y − y 0 = f ′ ( x 0 ) ( x − x 0 )
(2). 二元函数 z = f ( x , y ) z = f(x, y) z = f ( x , y )
在 ( x 0 , y 0 , z 0 ) (x_0, y_0, z_0) ( x 0 , y 0 , z 0 ) 处的微分 d z = f x ( x 0 , y 0 ) d x + f y ( x 0 , y 0 ) d y dz = f_x(x_0, y_0) dx + f_y(x_0, y_0) dy d z = f x ( x 0 , y 0 ) d x + f y ( x 0 , y 0 ) d y
在 ( x 0 , y 0 , z 0 ) (x_0, y_0, z_0) ( x 0 , y 0 , z 0 ) 处的切面 z − z 0 = f x ( x 0 , y 0 ) ( x − x 0 ) + f y ( x 0 , y 0 ) ( y − y 0 ) z - z_0 = f_x(x_0, y_0)(x - x_0) + f_y(x_0, y_0)(y - y_0) z − z 0 = f x ( x 0 , y 0 ) ( x − x 0 ) + f y ( x 0 , y 0 ) ( y − y 0 )
· 可微性验证
根据定义,验证多元函数的可微性只需验证下式是否成立
Δ z − f x Δ x − f y Δ y = o ( ρ ) ⇔ lim ρ → 0 + Δ z − f x Δ x − f y Δ y ρ = 0 \Delta z - f_x \Delta x - f_y \Delta y = o(\rho) \Leftrightarrow \lim_{\rho \to 0^+} \frac{\Delta z - f_x \Delta x - f_y \Delta y}{\rho} = 0
Δ z − f x Δ x − f y Δ y = o ( ρ ) ⇔ ρ → 0 + lim ρ Δ z − f x Δ x − f y Δ y = 0
/example/ z = ∣ x y ∣ z = \sqrt{|xy|} z = ∣ x y ∣ ,z z z 在 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 处是否可微?
/solution/
f x ( 0 , 0 ) = lim Δ x → 0 Δ x ⋅ 0 − 0 Δ x = 0 f_x(0, 0) = \lim_{\Delta x \to 0} \frac{\sqrt{\Delta x \cdot 0} - 0}{\Delta x} = 0 f x ( 0 , 0 ) = lim Δ x → 0 Δ x Δ x ⋅ 0 − 0 = 0 ,f y ( 0 , 0 ) = 0 f_y(0, 0) = 0 f y ( 0 , 0 ) = 0
lim ρ → 0 + ( Δ x Δ y − 0 ) − 0 Δ x − 0 Δ y ρ = lim ρ → 0 + ∣ sin θ cos θ ∣ \lim_{\rho \to 0^+} \frac{(\sqrt{\Delta x \Delta y} - 0) - 0 \Delta x - 0 \Delta y}{\rho} = \lim_{\rho \to 0^+} \sqrt{|\sin \theta \cos \theta|}
ρ → 0 + lim ρ ( Δ x Δ y − 0 ) − 0Δ x − 0Δ y = ρ → 0 + lim ∣ sin θ cos θ ∣
不存在,故不可微
定理3:若 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 的某邻域可导,且偏导函数 f x ( x , y ) f_x(x, y) f x ( x , y ) ,f y ( x , y ) f_y(x, y) f y ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 点连续,则 f ( x , y ) f(x, y) f ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 点可微。
/proof/
Δ z = f ( x + Δ x , y + Δ y ) − f ( x , y ) = f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) + f ( x + Δ x , y ) − f ( x , y ) \begin{align*}
\Delta z &= f(x + \Delta x, y + \Delta y) - f(x, y)\\
&= f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) + f(x + \Delta x, y) - f(x, y)
\end{align*}
Δ z = f ( x + Δ x , y + Δ y ) − f ( x , y ) = f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) + f ( x + Δ x , y ) − f ( x , y )
由条件知当 Δ x \Delta x Δ x 与 Δ y \Delta y Δ y 充分小时 f ( x , y ) f(x, y) f ( x , y ) 可导
把 f ( x + Δ x , y ) f(x + \Delta x, y) f ( x + Δ x , y ) 看作是 y y y 的一元函数,根据拉格朗日中值定理,存在 θ 1 ∈ ( 0 , 1 ) \theta_1 \in (0, 1) θ 1 ∈ ( 0 , 1 ) 使得
f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) = f y ( x + Δ x , y + θ 1 Δ y ) Δ y f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) = f_y(x + \Delta x, y + \theta_1 \Delta y) \Delta y
f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) = f y ( x + Δ x , y + θ 1 Δ y ) Δ y
同理存在 θ 2 ∈ ( 0 , 1 ) \theta_2 \in (0, 1) θ 2 ∈ ( 0 , 1 ) 使得 f ( x + Δ x , y ) − f ( x , y ) = f x ( x + θ 2 Δ x , y ) Δ x f(x + \Delta x, y) - f(x, y) = f_x(x + \theta_2 \Delta x, y) \Delta x f ( x + Δ x , y ) − f ( x , y ) = f x ( x + θ 2 Δ x , y ) Δ x
从而
Δ z − f x ( x , y ) Δ x − f y ( x , y ) Δ y \Delta z - f_x(x, y) \Delta x - f_y(x, y) \Delta y
Δ z − f x ( x , y ) Δ x − f y ( x , y ) Δ y
= [ f y ( x + Δ x , y + θ 1 Δ y ) − f y ( x , y ) ] Δ y + [ f x ( x + θ 2 Δ x , y ) − f x ( x , y ) ] Δ x = [f_y(x + \Delta x, y + \theta_1 \Delta y) - f_y(x, y)] \Delta y + [f_x(x + \theta_2 \Delta x, y) - f_x(x, y)] \Delta x
= [ f y ( x + Δ x , y + θ 1 Δ y ) − f y ( x , y )] Δ y + [ f x ( x + θ 2 Δ x , y ) − f x ( x , y )] Δ x
由于 f x ( x , y ) f_x(x, y) f x ( x , y ) ,f y ( x , y ) f_y(x, y) f y ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 点连续
f y ( x + Δ x , y + θ 1 Δ y ) − f y ( x , y ) → 0 ( ρ → 0 + ) f_y(x + \Delta x, y + \theta_1 \Delta y) - f_y(x, y) \rightarrow 0 \, (\rho \rightarrow 0^+) f y ( x + Δ x , y + θ 1 Δ y ) − f y ( x , y ) → 0 ( ρ → 0 + ) ,记为 o ( 1 ) o(1) o ( 1 )
同理 f x ( x + θ 2 Δ x , y ) − f x ( x , y ) = o ( 1 ) f_x(x + \theta_2 \Delta x, y) - f_x(x, y) = o(1) f x ( x + θ 2 Δ x , y ) − f x ( x , y ) = o ( 1 ) ,所以
lim ρ → 0 + Δ z − f x ( x , y ) Δ x − f y ( x , y ) Δ y ρ = lim ρ → 0 + ( o ( 1 ) Δ x ρ + o ( 1 ) Δ y ρ ) \lim_{\rho \to 0^+} \frac{\Delta z - f_x(x, y) \Delta x - f_y(x, y) \Delta y}{\rho} = \lim_{\rho \to 0^+} \left( o(1) \frac{\Delta x}{\rho} + o(1) \frac{\Delta y}{\rho} \right)
ρ → 0 + lim ρ Δ z − f x ( x , y ) Δ x − f y ( x , y ) Δ y = ρ → 0 + lim ( o ( 1 ) ρ Δ x + o ( 1 ) ρ Δ y )
又因为 ∣ Δ x ρ ∣ , ∣ Δ y ρ ∣ ≤ 1 \left| \frac{\Delta x}{\rho} \right|, \left| \frac{\Delta y}{\rho} \right| \leq 1 ρ Δ x , ρ Δ y ≤ 1 ,所以上面的极限为零,故 f ( x , y ) f(x, y) f ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 点可微
(1). 若将条件增强,假设 f x f_x f x ,f y f_y f y 在 ( x , y ) (x, y) ( x , y ) 的某邻域连续,可利用微积分基本定理
f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) = ∫ y y + Δ y f y ( x + Δ x , s ) d s = ∫ y y + Δ y [ f y ( x , y ) + o ( 1 ) ] d s = f y ( x , y ) Δ y + o ( 1 ) Δ y \begin{align*}
f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) = \int_y^{y+\Delta y} f_y(x + \Delta x, s) ds\\
= \int_y^{y+\Delta y} [f_y(x, y) + o(1)] ds = f_y(x, y) \Delta y + o(1) \Delta y
\end{align*}
f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) = ∫ y y + Δ y f y ( x + Δ x , s ) d s = ∫ y y + Δ y [ f y ( x , y ) + o ( 1 )] d s = f y ( x , y ) Δ y + o ( 1 ) Δ y
后续步骤省略
(2). 逆命题不成立,即偏导函数连续不是可微的必要条件
反例:f ( x , y ) = { ( x 2 + y 2 ) sin 1 x 2 + y 2 x 2 + y 2 ≠ 0 0 x 2 + y 2 = 0 f(x, y) = \begin{cases}
(x^2 + y^2) \sin \frac{1}{x^2 + y^2} & x^2 + y^2 \neq 0 \\
0 & x^2 + y^2 = 0
\end{cases} f ( x , y ) = { ( x 2 + y 2 ) sin x 2 + y 2 1 0 x 2 + y 2 = 0 x 2 + y 2 = 0
(3). 由证明可以看出,可微性只需验证 Δ z = f x Δ x + f y Δ y + o ( 1 ) Δ x + o ( 1 ) Δ y \Delta z = f_x \Delta x + f_y \Delta y + o(1) \Delta x + o(1) \Delta y Δ z = f x Δ x + f y Δ y + o ( 1 ) Δ x + o ( 1 ) Δ y
将上面的叙述严格的语言写出来,就是如下的引理
引理1:Δ z = f x Δ x + f y Δ y + o ( 1 ) Δ x + o ( 1 ) Δ y \Delta z = f_x \Delta x + f_y \Delta y + o(1) \Delta x + o(1) \Delta y Δ z = f x Δ x + f y Δ y + o ( 1 ) Δ x + o ( 1 ) Δ y 等价于
Δ z = f x Δ x + f y Δ y + o ( ρ ) , ρ → 0 + \Delta z = f_x \Delta x + f_y \Delta y + o(\rho),\rho \to 0^+
Δ z = f x Δ x + f y Δ y + o ( ρ ) , ρ → 0 +
/proof/
必要性在证明过程中已经体现,下证充分性
事实上,我们只需证明 o ( ρ ) o(\rho) o ( ρ ) 可以分解成 o ( 1 ) Δ x + o ( 1 ) Δ y o(1) \Delta x + o(1) \Delta y o ( 1 ) Δ x + o ( 1 ) Δ y 即可
任取 f ( x , y ) = o ( ρ ) f(x, y) = o(\rho) f ( x , y ) = o ( ρ ) ,有 lim ρ → 0 + f ( x , y ) ρ = 0 \lim_{\rho \to 0^+} \frac{f(x, y)}{\rho} = 0 lim ρ → 0 + ρ f ( x , y ) = 0 ,从而 f ( x , y ) ρ = o ( 1 ) \frac{f(x, y)}{\rho} = o(1) ρ f ( x , y ) = o ( 1 )
令 f 1 ( x , y ) = f ( x , y ) ρ ∣ Δ x ∣ = o ( 1 ) Δ x f_1(x, y) = \frac{f(x, y)}{\rho} |\Delta x| = o(1) \Delta x f 1 ( x , y ) = ρ f ( x , y ) ∣Δ x ∣ = o ( 1 ) Δ x
f 2 ( x , y ) = f ( x , y ) − f 1 ( x , y ) = f ( x , y ) ρ ( ρ − ∣ Δ x ∣ ) Δ y f_2(x, y) = f(x, y) - f_1(x, y) = \frac{f(x, y)}{\rho} (\rho - |\Delta x|) \Delta y
f 2 ( x , y ) = f ( x , y ) − f 1 ( x , y ) = ρ f ( x , y ) ( ρ − ∣Δ x ∣ ) Δ y
从而 f ( x , y ) = f 1 ( x , y ) + f 2 ( x , y ) f(x, y) = f_1(x, y) + f_2(x, y) f ( x , y ) = f 1 ( x , y ) + f 2 ( x , y )
(4). 证明过程中利用到中值定理,可以归结为如下二元函数的中值定理
引理2:若 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 的某邻域可导,则当 Δ x \Delta x Δ x 与 Δ y \Delta y Δ y 充分小时,全增量
Δ z = f x ( x + θ 1 Δ x , y + Δ y ) Δ x + f y ( x , y + θ 2 Δ y ) Δ y \Delta z = f_x(x + \theta_1 \Delta x, y + \Delta y) \Delta x + f_y(x, y + \theta_2 \Delta y) \Delta y
Δ z = f x ( x + θ 1 Δ x , y + Δ y ) Δ x + f y ( x , y + θ 2 Δ y ) Δ y
其中 θ 1 , θ 2 ∈ ( 0 , 1 ) \theta_1, \theta_2 \in (0, 1) θ 1 , θ 2 ∈ ( 0 , 1 ) 。
· 高阶偏导
/Define/
二元函数 z = f ( x , y ) z = f(x, y) z = f ( x , y ) 的偏导数 f x ( x , y ) f_x(x, y) f x ( x , y ) 仍是二元函数,若其仍然可导,其对 x x x 的偏导数记为 f x x f_{xx} f xx 或 ∂ 2 f ∂ x 2 \frac{\partial^2 f}{\partial x^2} ∂ x 2 ∂ 2 f ;对 y y y 的偏导数记为 f x y f_{xy} f x y 或 ∂ 2 f ∂ x ∂ y \frac{\partial^2 f}{\partial x \partial y} ∂ x ∂ y ∂ 2 f ,类似地还有 f y x f_{yx} f y x 和 f y y f_{yy} f yy 。其中 f x y f_{xy} f x y 与 f y x f_{yx} f y x 称为二阶混合偏导数
事实上,二阶混合偏导数 $ f_{xy} $ 与 f y x f_{yx} f y x 并不一定相等。
反例: f ( x , y ) = { x 2 y 2 − y 2 x 2 + y 2 x 2 + y 2 ≠ 0 0 x 2 + y 2 = 0 f(x, y) = \begin{cases}
\frac{x^2 y^2 - y^2}{x^2 + y^2} & x^2 + y^2 \neq 0 \\
0 & x^2 + y^2 = 0
\end{cases} f ( x , y ) = { x 2 + y 2 x 2 y 2 − y 2 0 x 2 + y 2 = 0 x 2 + y 2 = 0
我们将 f x y ( x , y ) f_{xy}(x, y) f x y ( x , y ) 表示成极限,即 f x ( x , y ) = lim Δ x → 0 f ( x + Δ x , y ) − f ( x , y ) Δ x f_x(x, y) = \lim_{\Delta x \to 0} \frac{f(x + \Delta x, y) - f(x, y)}{\Delta x} f x ( x , y ) = lim Δ x → 0 Δ x f ( x + Δ x , y ) − f ( x , y ) ,从而
f x y ( x , y ) = lim Δ y → 0 f x ( x , y + Δ y ) − f x ( x , y ) Δ y = lim Δ y → 0 lim Δ x → 0 f ( x + Δ x , y + Δ y ) − f ( x , y + Δ y ) − f ( x + Δ x , y ) + f ( x , y ) Δ x Δ y \begin{align*}
f_{xy}(x, y) &= \lim_{\Delta y \to 0} \frac{f_x(x, y + \Delta y) - f_x(x, y)}{\Delta y}\\
&= \lim_{\Delta y \to 0} \lim_{\Delta x \to 0} \frac{f(x + \Delta x, y + \Delta y) - f(x, y + \Delta y) - f(x + \Delta x, y) + f(x, y)}{\Delta x \Delta y}
\end{align*}
f x y ( x , y ) = Δ y → 0 lim Δ y f x ( x , y + Δ y ) − f x ( x , y ) = Δ y → 0 lim Δ x → 0 lim Δ x Δ y f ( x + Δ x , y + Δ y ) − f ( x , y + Δ y ) − f ( x + Δ x , y ) + f ( x , y )
同理
f y x ( x , y ) = lim Δ y → 0 lim Δ x → 0 f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) − f ( x , y + Δ y ) + f ( x , y ) Δ x Δ y f_{yx}(x, y) = \lim_{\Delta y \to 0} \lim_{\Delta x \to 0} \frac{f(x + \Delta x, y + \Delta y) - f(x + \Delta x, y) - f(x, y + \Delta y) + f(x, y)}{\Delta x \Delta y}
f y x ( x , y ) = Δ y → 0 lim Δ x → 0 lim Δ x Δ y f ( x + Δ x , y + Δ y ) − f ( x + Δ x , y ) − f ( x , y + Δ y ) + f ( x , y )
于是 f x y f_{xy} f x y 与 f y x f_{yx} f y x 是否相等归结于上面两个累次极限能否换序的问题
定理4:若 f x y ( x , y ) f_{xy}(x, y) f x y ( x , y ) 与 f y x ( x , y ) f_{yx}(x, y) f y x ( x , y ) 在 ( x , y ) (x, y) ( x , y ) 连续,则二者相等。
证明过程略(饶了我吧)
推广到 $ n $ 阶偏导,若 $ f $ 具有直到 $ n $ 阶的连续偏导数,则混合偏导数与求导顺序无关
在数学分析中,今后都默认多元函数的偏导数连续,从而混合偏导数与求导顺序无关。为了叙述方便,我们引入记号 $ C^k(E) $ ,其中 $ E \subset \mathbb{R}^2, k \geq +\infty $ 表示全体不超过 $ k $ 阶的所有偏导数都在 $ E $ 连续的函数的集合
由于我们默认高阶偏导的求导顺序可以交换,我们可以定义微分算子 的记号
( a ∂ ∂ x + b ∂ ∂ y ) n ∂ n f ∂ x i ∂ y j = ∑ i = 0 n C n i ( a ∂ ∂ x ) i ( b ∂ ∂ y ) n − i = ∑ i = 0 n C n i a i b n − i ∂ n ∂ x i ∂ y n − i \left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right)^n \frac{\partial^n f}{\partial x^i \partial y^j} = \sum_{i=0}^n C_n^i \left( a \frac{\partial}{\partial x} \right)^i \left( b \frac{\partial}{\partial y} \right)^{n-i} = \sum_{i=0}^n C_n^i a^i b^{n-i} \frac{\partial^n}{\partial x^i \partial y^{n-i}}
( a ∂ x ∂ + b ∂ y ∂ ) n ∂ x i ∂ y j ∂ n f = i = 0 ∑ n C n i ( a ∂ x ∂ ) i ( b ∂ y ∂ ) n − i = i = 0 ∑ n C n i a i b n − i ∂ x i ∂ y n − i ∂ n
( a ∂ ∂ x + b ∂ ∂ y ) n f = ∑ i = 0 n C n i a i b n − i ∂ n f ∂ x i ∂ y n − i \left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right)^n f = \sum_{i=0}^n C_n^i a^i b^{n-i} \frac{\partial^n f}{\partial x^i \partial y^{n-i}}
( a ∂ x ∂ + b ∂ y ∂ ) n f = i = 0 ∑ n C n i a i b n − i ∂ x i ∂ y n − i ∂ n f
注意,此记号只是形式上写成幂次形式,不能把 ( a ∂ ∂ x + b ∂ ∂ y ) n \left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right)^n ( a ∂ x ∂ + b ∂ y ∂ ) n 理解为 n n n 个 ( a ∂ ∂ x + b ∂ ∂ y ) \left( a \frac{\partial}{\partial x} + b \frac{\partial}{\partial y} \right) ( a ∂ x ∂ + b ∂ y ∂ ) 的复合
Fragment 3 复合函数微分法
· 复合函数的偏导数
在一元函数微分学中,复合函数 z = f ( y ) z = f(y) z = f ( y ) , y = g ( x ) y = g(x) y = g ( x ) ,有链式法则 d z d x = d z d y d y d x \frac{dz}{dx} = \frac{dz}{dy} \frac{dy}{dx} d x d z = d y d z d x d y 。
而二元复合函数 z = f ( x , y ) z = f(x, y) z = f ( x , y ) , z = φ ( s , t ) z = \varphi(s, t) z = φ ( s , t ) , y = ψ ( s , t ) y = \psi(s, t) y = ψ ( s , t ) 能否求导?如何求导?
定理(链式法则) :对上述二元复合函数,若 x s , x t , y s , y t x_s, x_t, y_s, y_t x s , x t , y s , y t 在 ( s , t ) (s, t) ( s , t ) 存在,且 f f f 在 ( s , t ) (s, t) ( s , t ) 对应的 ( x , y ) (x, y) ( x , y ) 可微,则复合函数在 ( s , t ) (s, t) ( s , t ) 的偏导数存在,且
∂ z ∂ s = ∂ f ∂ x ∂ x ∂ s + ∂ f ∂ y ∂ y ∂ s ∂ z ∂ t = ∂ f ∂ x ∂ x ∂ t + ∂ f ∂ y ∂ y ∂ t \frac{\partial z}{\partial s} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial s} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial s} \\
\frac{\partial z}{\partial t} = \frac{\partial f}{\partial x} \frac{\partial x}{\partial t} + \frac{\partial f}{\partial y} \frac{\partial y}{\partial t}
∂ s ∂ z = ∂ x ∂ f ∂ s ∂ x + ∂ y ∂ f ∂ s ∂ y ∂ t ∂ z = ∂ x ∂ f ∂ t ∂ x + ∂ y ∂ f ∂ t ∂ y
(1). 定理中可微的条件不可以省略
(2). 其中 ∂ f ∂ x , ∂ f ∂ y \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y} ∂ x ∂ f , ∂ y ∂ f 是关于 $ x, y $ 的二元函数, ∂ x ∂ s , ∂ x ∂ t , ∂ y ∂ s , ∂ y ∂ t \frac{\partial x}{\partial s}, \frac{\partial x}{\partial t}, \frac{\partial y}{\partial s}, \frac{\partial y}{\partial t} ∂ s ∂ x , ∂ t ∂ x , ∂ s ∂ y , ∂ t ∂ y 是关于 s , t s, t s , t 的二元函数
(3). 上式可以写成矩阵形式
[ ∂ z ∂ s ∂ z ∂ t ] = [ ∂ x ∂ s ∂ y ∂ s ∂ x ∂ t ∂ y ∂ t ] [ ∂ f ∂ x ∂ f ∂ y ] \begin{bmatrix}
\frac{\partial z}{\partial s} \\
\frac{\partial z}{\partial t}
\end{bmatrix}
=\begin{bmatrix}
\frac{\partial x}{\partial s} & \frac{\partial y}{\partial s} \\
\frac{\partial x}{\partial t} & \frac{\partial y}{\partial t}
\end{bmatrix}
\begin{bmatrix}
\frac{\partial f}{\partial x} \\
\frac{\partial f}{\partial y}
\end{bmatrix}
[ ∂ s ∂ z ∂ t ∂ z ] = [ ∂ s ∂ x ∂ t ∂ x ∂ s ∂ y ∂ t ∂ y ] [ ∂ x ∂ f ∂ y ∂ f ]
其中
[ ∂ x ∂ s ∂ y ∂ s ∂ x ∂ t ∂ y ∂ t ] \begin{bmatrix}
\frac{\partial x}{\partial s} & \frac{\partial y}{\partial s} \\
\frac{\partial x}{\partial t} & \frac{\partial y}{\partial t}
\end{bmatrix}
[ ∂ s ∂ x ∂ t ∂ x ∂ s ∂ y ∂ t ∂ y ]
称为雅可比矩阵
(4). 从微分的角度(一阶全微分形式的不变性)
将 { d x = φ s d s + φ t d t d y = ψ s d s + ψ t d t \begin{cases} dx = \varphi_s ds + \varphi_t dt \\ dy = \psi_s ds + \psi_t dt \end{cases} { d x = φ s d s + φ t d t d y = ψ s d s + ψ t d t 代入 d z = f x d x + f y d y dz = f_x dx + f_y dy d z = f x d x + f y d y ,得到
d z = ( f x φ s + f y ψ s ) d s + ( f x φ t + f y ψ t ) d t dz = (f_x \varphi_s + f_y \psi_s) ds + (f_x \varphi_t + f_y \psi_t) dt
d z = ( f x φ s + f y ψ s ) d s + ( f x φ t + f y ψ t ) d t
根据全微分表示式可写成:
{ z s = f x φ s + f y ψ s z t = f x φ t + f y ψ t \begin{cases}
z_s = f_x \varphi_s + f_y \psi_s \\
z_t = f_x \varphi_t + f_y \psi_t
\end{cases}
{ z s = f x φ s + f y ψ s z t = f x φ t + f y ψ t
/example/ z = f ( x , y , t ) z = f(x, y, t) z = f ( x , y , t ) ,x = φ ( s , t ) x = \varphi(s, t) x = φ ( s , t ) ,y = ψ ( s , t ) y = \psi(s, t) y = ψ ( s , t ) ,求 z s z_s z s 和 z t z_t z t
/solution/ z s = f x x s + f y y s z_s = f_x x_s + f_y y_s z s = f x x s + f y y s ,z t = f x x t + f y y t + f t z_t = f_x x_t + f_y y_t + f_t z t = f x x t + f y y t + f t
注意第二个式子左边的 z s z_s z s 和右边的 f t f_t f t 表达的含义是不同的
其中 x t x_t x t 是指将自变量 z = f ( x , y , t ) z = f(x, y, t) z = f ( x , y , t ) 看成关于 s , t s, t s , t 的复合函数
(也就是 z = f ( φ ( s , t ) , ψ ( s , t ) , t ) z = f(\varphi(s, t), \psi(s, t), t) z = f ( φ ( s , t ) , ψ ( s , t ) , t ) )再对 t t t 求偏导,所以 z t z_t z t 也是关于 s , t s, t s , t 的函数
而 f t f_t f t 则是指将 f f f 看作三元函数再对第三个分量求偏导,f t f_t f t 是关于 x , y , t x, y, t x , y , t 的函数
进一步解释,就是将 f f f 看成 R 3 \mathbb{R}^3 R 3 到 R \mathbb{R} R 的映射,即 f : ( a , b , c ) ⟶ f ( a , b , c ) f: (a, b, c) \longrightarrow f(a, b, c) f : ( a , b , c ) ⟶ f ( a , b , c )
这里的 a , b , c a, b, c a , b , c 是什么字母并不重要,重要的只是它们的顺序
为了避免歧义,我们今后将这里的 f x , f y , f t f_x, f_y, f_t f x , f y , f t 记作 f 1 , f 2 , f 3 f_1, f_2, f_3 f 1 , f 2 , f 3 ,表示对分量求偏导
所以本题也可以写作 z s = f 1 x s + f 2 y s z_s = f_1 x_s + f_2 y_s z s = f 1 x s + f 2 y s ,z t = f 1 x t + f 2 y t + f 3 z_t = f_1 x_t + f_2 y_t + f_3 z t = f 1 x t + f 2 y t + f 3
· 隐函数偏导数
在此部分,我们总是假设隐函数(组)是存在的,且性质足够好,是可导的. (至于在什么条件下此假设成立,那是数学分析和高等微积分要干的事情,我们直接跳过不做过多讨论)
对于单个方程来说:设 F ( x , y ) = 0 F(x, y) = 0 F ( x , y ) = 0 定义了一个函数 y = y ( x ) y = y(x) y = y ( x ) ,如何求 y ′ ( x ) y'(x) y ′ ( x ) ?
求导法 :F ( x , y ) = 0 F(x, y) = 0 F ( x , y ) = 0 ,y = y ( x ) y = y(x) y = y ( x ) 为二元复合函数
对 x x x 求导 F x + F y y ′ ( x ) = 0 F_x + F_y y'(x) = 0 F x + F y y ′ ( x ) = 0 ,故 y ′ ( x ) = − F x F y y'(x) = -\frac{F_x}{F_y} y ′ ( x ) = − F y F x
微分法 :对 F ( x , y ) = 0 F(x, y) = 0 F ( x , y ) = 0 微分 F x d x + F y d y = 0 F_x dx + F_y dy = 0 F x d x + F y d y = 0 ,故 d y d x = − F x F y \frac{dy}{dx} = -\frac{F_x}{F_y} d x d y = − F y F x
PS :默认 F y ≠ 0 F_y \neq 0 F y = 0 ,上述方法可以推广到多元的情况
Q :设 F ( x , y , z ) = 0 F(x, y, z) = 0 F ( x , y , z ) = 0 定义了一个函数 z = z ( x , y ) z = z(x, y) z = z ( x , y ) ,如何求 ∂ z ∂ x \frac{\partial z}{\partial x} ∂ x ∂ z 和 ∂ z ∂ y \frac{\partial z}{\partial y} ∂ y ∂ z ?
法一(求导法) :F ( x , y , z ) = 0 F(x, y, z) = 0 F ( x , y , z ) = 0 ,z = z ( x , y ) z = z(x, y) z = z ( x , y ) 为三元复合函数
对 x x x 求偏导 F x + F z ∂ z ∂ x = 0 F_x + F_z \frac{\partial z}{\partial x} = 0 F x + F z ∂ x ∂ z = 0 ,故 ∂ z ∂ x = − F x F z \frac{\partial z}{\partial x} = -\frac{F_x}{F_z} ∂ x ∂ z = − F z F x ,同理对 y y y 求偏导得 ∂ z ∂ y = − F y F z \frac{\partial z}{\partial y} = -\frac{F_y}{F_z} ∂ y ∂ z = − F z F y
法二(微分法) :对 F ( x , y , z ) = 0 F(x, y, z) = 0 F ( x , y , z ) = 0 微分 F x d x + F y d y + F z d z = 0 F_x dx + F_y dy + F_z dz = 0 F x d x + F y d y + F z d z = 0 ,移项得
d z = − F x F z d x − F y F z d y , ∂ z ∂ x = − F x F z , ∂ z ∂ y = − F y F z dz = -\frac{F_x}{F_z} dx - \frac{F_y}{F_z} dy,\quad \frac{\partial z}{\partial x} = -\frac{F_x}{F_z},\quad \frac{\partial z}{\partial y} = -\frac{F_y}{F_z}
d z = − F z F x d x − F z F y d y , ∂ x ∂ z = − F z F x , ∂ y ∂ z = − F z F y
PS :同时算多个偏导数时,用微分法比较简单。
考虑方程组
{ F ( x , y , z ) = 0 G ( x , y , z ) = 0 \begin{cases}
F(x, y, z) = 0 \\
G(x, y, z) = 0
\end{cases}
{ F ( x , y , z ) = 0 G ( x , y , z ) = 0
在定义域内任取 x x x (固定),则方程组退化为关于 y , z y, z y , z 的二元线性方程组
若方程组性质足够好,可以解出唯一解 y , z y, z y , z ,则我们说其定义了隐函数组
{ y = y ( x ) z = z ( x ) \begin{cases}
y = y(x) \\
z = z(x)
\end{cases}
{ y = y ( x ) z = z ( x )
进一步,若这两个隐函数可导,如何求 y ′ ( x ) y'(x) y ′ ( x ) 和 z ′ ( x ) z'(x) z ′ ( x ) ?
求导法 :将 y = y ( x ) , z = z ( x ) y = y(x), z = z(x) y = y ( x ) , z = z ( x ) 带入方程组,即
{ F ( x , y ( x ) , z ( x ) ) = 0 G ( x , y ( x ) , z ( x ) ) = 0 \begin{cases}
F(x, y(x), z(x)) = 0 \\
G(x, y(x), z(x)) = 0
\end{cases}
{ F ( x , y ( x ) , z ( x )) = 0 G ( x , y ( x ) , z ( x )) = 0
此时左边是关于 x x x 的复合函数,求导得
{ F x + F y y ′ ( x ) + F z z ′ ( x ) = 0 G x + G y y ′ ( x ) + G z z ′ ( x ) = 0 \begin{cases}
F_x + F_y y'(x) + F_z z'(x) = 0 \\
G_x + G_y y'(x) + G_z z'(x) = 0
\end{cases}
{ F x + F y y ′ ( x ) + F z z ′ ( x ) = 0 G x + G y y ′ ( x ) + G z z ′ ( x ) = 0
写成矩阵的形式就是
( F y F z G y G z ) ( y ′ z ′ ) = ( − F x − G x ) \begin{pmatrix}
F_y & F_z \\
G_y & G_z
\end{pmatrix}
\begin{pmatrix}
y' \\
z'
\end{pmatrix}
=
\begin{pmatrix}
-F_x \\
-G_x
\end{pmatrix}
( F y G y F z G z ) ( y ′ z ′ ) = ( − F x − G x )
左边第一矩阵称为雅可比矩阵,引入记号 ∂ ( F , G ) ∂ ( y , z ) = ∣ F y F z G y G z ∣ \frac{\partial (F, G)}{\partial (y, z)} = \begin{vmatrix} F_y & F_z \\ G_y & G_z \end{vmatrix} ∂ ( y , z ) ∂ ( F , G ) = F y G y F z G z 表示其行列式
若 ∂ ( F , G ) ∂ ( y , z ) = ∣ F y F z G y G z ∣ ≠ 0 \frac{\partial (F, G)}{\partial (y, z)} = \begin{vmatrix} F_y & F_z \\ G_y & G_z \end{vmatrix} \neq 0 ∂ ( y , z ) ∂ ( F , G ) = F y G y F z G z = 0 ,则雅可比矩阵可逆
从而可以解得
( y ′ z ′ ) = ( F y F z G y G z ) − 1 ( − F x − G x ) \begin{pmatrix}
y' \\
z'
\end{pmatrix}
=
\begin{pmatrix}
F_y & F_z \\
G_y & G_z
\end{pmatrix}^{-1}
\begin{pmatrix}
-F_x \\
-G_x
\end{pmatrix}
( y ′ z ′ ) = ( F y G y F z G z ) − 1 ( − F x − G x )
微分法 :对方程组求微分得
{ F x d x + F y d y + F z d z = 0 G x d x + G y d y + G z d z = 0 \begin{cases}
F_x dx + F_y dy + F_z dz = 0 \\
G_x dx + G_y dy + G_z dz = 0
\end{cases}
{ F x d x + F y d y + F z d z = 0 G x d x + G y d y + G z d z = 0
写成矩阵的形式
( F y F z G y G z ) ( d y d z ) = ( − F x − G x ) d x \begin{pmatrix}
F_y & F_z \\
G_y & G_z
\end{pmatrix}
\begin{pmatrix}
dy \\
dz
\end{pmatrix}
=
\begin{pmatrix}
-F_x \\
-G_x
\end{pmatrix} dx
( F y G y F z G z ) ( d y d z ) = ( − F x − G x ) d x
后续步骤同理
Fragment 4 方向导数 梯度
前面我们定义了二元函数 f ( x , y ) f(x, y) f ( x , y ) 的偏导数 f x ( x 0 , y 0 ) f_x(x_0, y_0) f x ( x 0 , y 0 ) 和 f y ( x 0 , y 0 ) f_y(x_0, y_0) f y ( x 0 , y 0 )
它们分别是沿两个坐标轴方向求导,现在我们来定义任意方向上的导数
/Define/
设 f ( x , y ) f(x, y) f ( x , y ) 在 P 0 ( x 0 , y 0 ) P_0(x_0, y_0) P 0 ( x 0 , y 0 ) 的某邻域内有定义,记单位方向向量 l ⃗ = ( α , β ) \vec{l} = (\alpha, \beta) l = ( α , β ) 满足 α 2 + β 2 = 1 \alpha^2 + \beta^2 = 1 α 2 + β 2 = 1 ,若极限
lim t → 0 + f ( x 0 + t α , y 0 + t β ) − f ( x 0 , y 0 ) t \lim_{t \to 0^+} \frac{f(x_0 + t\alpha, y_0 + t\beta) - f(x_0, y_0)}{t}
t → 0 + lim t f ( x 0 + t α , y 0 + tβ ) − f ( x 0 , y 0 )
存在,则称为 f f f 在 P 0 P_0 P 0 沿方向 l l l 的方向导数,记为 ∂ f ∂ l ∣ P 0 \frac{\partial f}{\partial l}\bigg|_{P_0} ∂ l ∂ f P 0 或 f l ( P 0 ) f_l(P_0) f l ( P 0 )
注意 :若 l ⃗ = ( 1 , 0 ) \vec{l} = (1, 0) l = ( 1 , 0 ) ,则 f l ( P 0 ) = lim t → 0 + f ( x 0 + t , y 0 ) − f ( x 0 , y 0 ) t = f x ( P 0 ) f_l(P_0) = \lim_{t \to 0^+} \frac{f(x_0 + t, y_0) - f(x_0, y_0)}{t} = f_x(P_0) f l ( P 0 ) = lim t → 0 + t f ( x 0 + t , y 0 ) − f ( x 0 , y 0 ) = f x ( P 0 ) ;若 l ⃗ = ( − 1 , 0 ) \vec{l} = (-1, 0) l = ( − 1 , 0 ) ,则 f l ( P 0 ) = − f x ( P 0 ) f_l(P_0) = -f_x(P_0) f l ( P 0 ) = − f x ( P 0 ) (区分正负)。
方向导数的定义可以推广到 n n n 元函数
/Define/
设 f ( x 1 , … , x n ) f(x_1, \ldots, x_n) f ( x 1 , … , x n ) 在 P 0 ( x 1 ( 0 ) , … , x n ( 0 ) ) P_0(x_1^{(0)}, \ldots, x_n^{(0)}) P 0 ( x 1 ( 0 ) , … , x n ( 0 ) ) 的某邻域内有定义,
记单位方向向量 l ⃗ = ( cos α 1 , … , cos α n ) \vec{l} = (\cos \alpha_1, \ldots, \cos \alpha_n) l = ( cos α 1 , … , cos α n ) 满足 cos 2 α 1 + ⋯ + cos 2 α n = 1 \cos^2 \alpha_1 + \cdots + \cos^2 \alpha_n = 1 cos 2 α 1 + ⋯ + cos 2 α n = 1 ,若极限
lim t → 0 + f ( x 1 ( 0 ) + t cos α 1 , … , x n ( 0 ) + t cos α n ) − f ( x 1 ( 0 ) , … , x n ( 0 ) ) t \lim_{t \to 0^+} \frac{f(x_1^{(0)} + t\cos \alpha_1, \ldots, x_n^{(0)} + t\cos \alpha_n) - f(x_1^{(0)}, \ldots, x_n^{(0)})}{t}
t → 0 + lim t f ( x 1 ( 0 ) + t cos α 1 , … , x n ( 0 ) + t cos α n ) − f ( x 1 ( 0 ) , … , x n ( 0 ) )
存在,则称为 f f f 在 P 0 P_0 P 0 沿方向 l ⃗ \vec{l} l 的方向导数,记为 ∂ f ∂ l ⃗ ∣ P 0 \frac{\partial f}{\partial \vec{l}}\bigg|_{P_0} ∂ l ∂ f P 0 或 f l ⃗ ( P 0 ) f_{\vec{l}}(P_0) f l ( P 0 ) ,其中 α i \alpha_i α i 称为方向角。
下面的定理说明了方向导数与偏导数的关系,我们记二元函数为例
/Theorem/:若 f f f 在 P 0 P_0 P 0 点可微,则 f f f 在 P 0 P_0 P 0 沿任意方向 l ⃗ = ( cos α , cos β , cos γ ) \vec{l} = (\cos \alpha, \cos \beta, \cos \gamma) l = ( cos α , cos β , cos γ ) (单位向量 cos 2 α + cos 2 β + cos 2 γ = 1 \cos^2 \alpha + \cos^2 \beta + \cos^2 \gamma = 1 cos 2 α + cos 2 β + cos 2 γ = 1 )的方向导数均存在,且
∂ f ∂ l ⃗ ∣ P 0 = f x ( P 0 ) cos α + f y ( P 0 ) cos β + f z ( P 0 ) cos γ \frac{\partial f}{\partial \vec{l}}\bigg|_{P_0} = f_x(P_0) \cos \alpha + f_y(P_0) \cos \beta + f_z(P_0) \cos \gamma
∂ l ∂ f P 0 = f x ( P 0 ) cos α + f y ( P 0 ) cos β + f z ( P 0 ) cos γ
/proof/
由可微,f ( x 0 + Δ x , y 0 + Δ y , z 0 + Δ z ) − f ( x 0 , y 0 , z 0 ) = f x ( P 0 ) Δ x + f y ( P 0 ) Δ y + f z ( P 0 ) Δ z + o ( ρ ) f(x_0 + \Delta x, y_0 + \Delta y, z_0 + \Delta z) - f(x_0, y_0, z_0) = f_x(P_0) \Delta x + f_y(P_0) \Delta y + f_z(P_0) \Delta z + o(\rho) f ( x 0 + Δ x , y 0 + Δ y , z 0 + Δ z ) − f ( x 0 , y 0 , z 0 ) = f x ( P 0 ) Δ x + f y ( P 0 ) Δ y + f z ( P 0 ) Δ z + o ( ρ )
其中 ρ = Δ x 2 + Δ y 2 + Δ z 2 \rho = \sqrt{\Delta x^2 + \Delta y^2 + \Delta z^2} ρ = Δ x 2 + Δ y 2 + Δ z 2
令 ( Δ x , Δ y , Δ z ) = t ( cos α , cos β , cos γ ) = t l ⃗ (\Delta x, \Delta y, \Delta z) = t(\cos \alpha, \cos \beta, \cos \gamma) = t \vec{l} ( Δ x , Δ y , Δ z ) = t ( cos α , cos β , cos γ ) = t l ,则 ρ = t \rho = t ρ = t
等式两边除以 t t t 并取极限 t → 0 + t \to 0^+ t → 0 + ,即可得到结论
紧接着给出梯度定义:
/Define/
若 f ( x , y , z ) f(x, y, z) f ( x , y , z ) 在 P 0 ( x 0 , y 0 , z 0 ) P_0(x_0, y_0, z_0) P 0 ( x 0 , y 0 , z 0 ) 沿任意方向的方向导数均存在,则称向量 ( f x ( P 0 ) , f y ( P 0 ) , f z ( P 0 ) ) (f_x(P_0), f_y(P_0), f_z(P_0)) ( f x ( P 0 ) , f y ( P 0 ) , f z ( P 0 )) 为 f f f 在 P 0 P_0 P 0 的梯度,记作 ∇ f ( P 0 ) \nabla f(P_0) ∇ f ( P 0 ) 或 ∇ f ( P 0 ) \nabla f(P_0) ∇ f ( P 0 ) 。
注意 :定理(方向导数与偏导数关系)可以写成 ∂ f ∂ l ⃗ = ∇ f ( P 0 ) ⋅ l ⃗ = ∣ ∇ f ( P 0 ) ∣ ∣ l ⃗ ∣ cos θ \frac{\partial f}{\partial \vec{l}} = \nabla f(P_0) \cdot \vec{l} = |\nabla f(P_0)| |\vec{l}| \cos \theta ∂ l ∂ f = ∇ f ( P 0 ) ⋅ l = ∣∇ f ( P 0 ) ∣∣ l ∣ cos θ ,从而 − ∣ ∇ f ( P 0 ) ∣ ≤ ∂ f ∂ l ⃗ ≤ ∣ ∇ f ( P 0 ) ∣ -|\nabla f(P_0)| \leq \frac{\partial f}{\partial \vec{l}} \leq |\nabla f(P_0)| − ∣∇ f ( P 0 ) ∣ ≤ ∂ l ∂ f ≤ ∣∇ f ( P 0 ) ∣
当 l ⃗ \vec{l} l 与 ∇ f ( P 0 ) \nabla f(P_0) ∇ f ( P 0 ) 的方向一致时,方向导数 ∂ f ∂ l ⃗ \frac{\partial f}{\partial \vec{l}} ∂ l ∂ f 可以取到上界,方向相反时可以取到下界
Q. :若 f f f 在 P 0 P_0 P 0 沿任意方向的方向导数都存在,能否推出 f f f 在 P 0 P_0 P 0 连续?
反例 :f ( x , y ) = { 0 ∣ y ∣ = x 2 , ( x , y ) ≠ ( 0 , 0 ) 1 else f(x, y) = \begin{cases}
0 & |y| = x^2, (x, y) \neq (0, 0) \\
1 & \text{else}
\end{cases} f ( x , y ) = { 0 1 ∣ y ∣ = x 2 , ( x , y ) = ( 0 , 0 ) else 在 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 显然不连续,而 f f f 在 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 沿任意方向的方向导数都存在且为零
Fragment 5 几何应用
· 曲线的切线和法平面
(1). 平面曲线
Q. :平面曲线 F ( x , y ) = 0 F(x, y) = 0 F ( x , y ) = 0 ,求 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 处的切线
直接微分 F x ( x 0 , y 0 ) d x + F y ( x 0 , y 0 ) d y = 0 F_x(x_0, y_0) dx + F_y(x_0, y_0) dy = 0 F x ( x 0 , y 0 ) d x + F y ( x 0 , y 0 ) d y = 0
若 F y ( x 0 , y 0 ) ≠ 0 F_y(x_0, y_0) \neq 0 F y ( x 0 , y 0 ) = 0 ,则 y ′ ( x 0 ) = − F x ( P 0 ) F y ( P 0 ) y'(x_0) = -\frac{F_x(P_0)}{F_y(P_0)} y ′ ( x 0 ) = − F y ( P 0 ) F x ( P 0 )
故切线为 y − y 0 = − F x ( P 0 ) F y ( P 0 ) ( x − x 0 ) y - y_0 = -\frac{F_x(P_0)}{F_y(P_0)}(x - x_0) y − y 0 = − F y ( P 0 ) F x ( P 0 ) ( x − x 0 )
若 F x ( x 0 , y 0 ) ≠ 0 F_x(x_0, y_0) \neq 0 F x ( x 0 , y 0 ) = 0 ,则 x ′ ( y 0 ) = − F y ( P 0 ) F x ( P 0 ) x'(y_0) = -\frac{F_y(P_0)}{F_x(P_0)} x ′ ( y 0 ) = − F x ( P 0 ) F y ( P 0 )
故切线为 x − x 0 = − F y ( P 0 ) F x ( P 0 ) ( y − y 0 ) x - x_0 = -\frac{F_y(P_0)}{F_x(P_0)}(y - y_0) x − x 0 = − F x ( P 0 ) F y ( P 0 ) ( y − y 0 )
将上面两种情况结合,切线方程为 F x ( P 0 ) ( x − x 0 ) + F y ( P 0 ) ( y − y 0 ) = 0 F_x(P_0)(x - x_0) + F_y(P_0)(y - y_0) = 0 F x ( P 0 ) ( x − x 0 ) + F y ( P 0 ) ( y − y 0 ) = 0
注意 :微分 F x ( x 0 , y 0 ) d x + F y ( x 0 , y 0 ) d y = 0 F_x(x_0, y_0) dx + F_y(x_0, y_0) dy = 0 F x ( x 0 , y 0 ) d x + F y ( x 0 , y 0 ) d y = 0 的本质是在局部用线性函数逼近原函数。因此去掉高阶项,即将 d x dx d x 换为 x − x 0 x - x_0 x − x 0 后,微分式就成为了切线方程。
(2). 空间曲线
Q :当空间曲线由参数方程 L : x = x ( t ) , y = y ( t ) , z = z ( t ) , α ≤ t ≤ β L: x = x(t), y = y(t), z = z(t), \alpha \leq t \leq \beta L : x = x ( t ) , y = y ( t ) , z = z ( t ) , α ≤ t ≤ β 给出,求 P 0 ( x ( t 0 ) , y ( t 0 ) , z ( t 0 ) ) P_0(x(t_0), y(t_0), z(t_0)) P 0 ( x ( t 0 ) , y ( t 0 ) , z ( t 0 )) 处切线和法平面
在曲线上取一点 Q ( x ( t ) , y ( t ) , z ( t ) ) Q(x(t), y(t), z(t)) Q ( x ( t ) , y ( t ) , z ( t ))
则割线 P 0 Q P_0Q P 0 Q 的方向为 P 0 Q ⃗ = ( x ( t ) − x ( t 0 ) t − t 0 , y ( t ) − y ( t 0 ) t − t 0 , z ( t ) − z ( t 0 ) t − t 0 ) \vec{P_0Q} = \left( \frac{x(t) - x(t_0)}{t - t_0}, \frac{y(t) - y(t_0)}{t - t_0}, \frac{z(t) - z(t_0)}{t - t_0} \right) P 0 Q = ( t − t 0 x ( t ) − x ( t 0 ) , t − t 0 y ( t ) − y ( t 0 ) , t − t 0 z ( t ) − z ( t 0 ) )
取极限 t → t 0 t \to t_0 t → t 0 ,则割线 P 0 Q P_0Q P 0 Q 的方向趋向于 ( x ′ ( t 0 ) , y ′ ( t 0 ) , z ′ ( t 0 ) ) (x'(t_0), y'(t_0), z'(t_0)) ( x ′ ( t 0 ) , y ′ ( t 0 ) , z ′ ( t 0 )) ,即切线方向
从而切线方程为 x − x 0 x ′ ( t 0 ) = y − y 0 y ′ ( t 0 ) = z − z 0 z ′ ( t 0 ) \frac{x - x_0}{x'(t_0)} = \frac{y - y_0}{y'(t_0)} = \frac{z - z_0}{z'(t_0)} x ′ ( t 0 ) x − x 0 = y ′ ( t 0 ) y − y 0 = z ′ ( t 0 ) z − z 0
法平面 :由 x ′ ( t 0 ) ( x − x 0 ) + y ′ ( t 0 ) ( y − y 0 ) + z ′ ( t 0 ) ( z − z 0 ) = 0 x'(t_0)(x - x_0) + y'(t_0)(y - y_0) + z'(t_0)(z - z_0) = 0 x ′ ( t 0 ) ( x − x 0 ) + y ′ ( t 0 ) ( y − y 0 ) + z ′ ( t 0 ) ( z − z 0 ) = 0
注意 :微分 d x = x ′ ( t 0 ) d t dx = x'(t_0) dt d x = x ′ ( t 0 ) d t ,去掉高阶项 { x − x 0 = x ′ ( t 0 ) ( t − t 0 ) y − y 0 = y ′ ( t 0 ) ( t − t 0 ) z − z 0 = z ′ ( t 0 ) ( t − t 0 ) \begin{cases} x - x_0 = x'(t_0)(t - t_0) \\ y - y_0 = y'(t_0)(t - t_0) \\ z - z_0 = z'(t_0)(t - t_0) \end{cases} ⎩ ⎨ ⎧ x − x 0 = x ′ ( t 0 ) ( t − t 0 ) y − y 0 = y ′ ( t 0 ) ( t − t 0 ) z − z 0 = z ′ ( t 0 ) ( t − t 0 ) 即为切线
Q. :当空间曲线由方程 L : { F ( x , y , z ) = 0 G ( x , y , z ) = 0 L: \begin{cases} F(x, y, z) = 0 \\ G(x, y, z) = 0 \end{cases} L : { F ( x , y , z ) = 0 G ( x , y , z ) = 0 给出,求 P 0 ( x 0 , y 0 , z 0 ) P_0(x_0, y_0, z_0) P 0 ( x 0 , y 0 , z 0 ) 处切线
微分 { F x d x + F y d y + F z d z = 0 G x d x + G y d y + G z d z = 0 \begin{cases} F_x dx + F_y dy + F_z dz = 0 \\ G_x dx + G_y dy + G_z dz = 0 \end{cases} { F x d x + F y d y + F z d z = 0 G x d x + G y d y + G z d z = 0 ,去掉高阶项
{ F x ( P 0 ) ( x − x 0 ) + F y ( P 0 ) ( y − y 0 ) + F z ( P 0 ) ( z − z 0 ) = 0 G x ( P 0 ) ( x − x 0 ) + G y ( P 0 ) ( y − y 0 ) + G z ( P 0 ) ( z − z 0 ) = 0 \begin{cases} F_x(P_0)(x - x_0) + F_y(P_0)(y - y_0) + F_z(P_0)(z - z_0) = 0 \\ G_x(P_0)(x - x_0) + G_y(P_0)(y - y_0) + G_z(P_0)(z - z_0) = 0 \end{cases}
{ F x ( P 0 ) ( x − x 0 ) + F y ( P 0 ) ( y − y 0 ) + F z ( P 0 ) ( z − z 0 ) = 0 G x ( P 0 ) ( x − x 0 ) + G y ( P 0 ) ( y − y 0 ) + G z ( P 0 ) ( z − z 0 ) = 0
即为切线方程
· 曲面的切平面与法线
问 :空间曲面 π : F ( x , y , z ) = 0 \pi: F(x, y, z) = 0 π : F ( x , y , z ) = 0 ,求 P 0 ( x 0 , y 0 , z 0 ) P_0(x_0, y_0, z_0) P 0 ( x 0 , y 0 , z 0 ) 处切平面与法线
微分 F x d x + F y d y + F z d z = 0 F_x dx + F_y dy + F_z dz = 0 F x d x + F y d y + F z d z = 0 ,去掉高阶项
F x ( P 0 ) ( x − x 0 ) + F y ( P 0 ) ( y − y 0 ) + F z ( P 0 ) ( z − z 0 ) = 0 F_x(P_0)(x - x_0) + F_y(P_0)(y - y_0) + F_z(P_0)(z - z_0) = 0 F x ( P 0 ) ( x − x 0 ) + F y ( P 0 ) ( y − y 0 ) + F z ( P 0 ) ( z − z 0 ) = 0 即为切平面方程
切平面的法向量为 r ⃗ = ( F x ( P 0 ) , F y ( P 0 ) , F z ( P 0 ) ) \vec{r} = (F_x(P_0), F_y(P_0), F_z(P_0)) r = ( F x ( P 0 ) , F y ( P 0 ) , F z ( P 0 ))
定理 :设空间曲面 π : F ( x , y , z ) = 0 \pi: F(x, y, z) = 0 π : F ( x , y , z ) = 0 中任意一条过 P 0 ( x 0 , y 0 , z 0 ) P_0(x_0, y_0, z_0) P 0 ( x 0 , y 0 , z 0 ) 的曲线为
L : x = x ( t ) , y = y ( t ) , z = z ( t ) L: x = x(t), y = y(t), z = z(t) L : x = x ( t ) , y = y ( t ) , z = z ( t ) ,则 L L L 在 P 0 P_0 P 0 的切线包含于 π \pi π 在 P 0 P_0 P 0 的切平面中。
/proof/
设 t = t 0 t = t_0 t = t 0 对应 P 0 ( x 0 , y 0 , z 0 ) P_0(x_0, y_0, z_0) P 0 ( x 0 , y 0 , z 0 ) ,由于 L L L 包含于 π \pi π 中,F ( x ( t ) , y ( t ) , z ( t ) ) = 0 F(x(t), y(t), z(t)) = 0 F ( x ( t ) , y ( t ) , z ( t )) = 0
求导得 F x ( P 0 ) ⋅ x ′ ( t 0 ) + F y ( P 0 ) ⋅ y ′ ( t 0 ) + F z ( P 0 ) ⋅ z ′ ( t 0 ) = 0 F_x(P_0) \cdot x'(t_0) + F_y(P_0) \cdot y'(t_0) + F_z(P_0) \cdot z'(t_0) = 0 F x ( P 0 ) ⋅ x ′ ( t 0 ) + F y ( P 0 ) ⋅ y ′ ( t 0 ) + F z ( P 0 ) ⋅ z ′ ( t 0 ) = 0
记 r ⃗ = ( F x ( P 0 ) , F y ( P 0 ) , F z ( P 0 ) ) \vec{r} = (F_x(P_0), F_y(P_0), F_z(P_0)) r = ( F x ( P 0 ) , F y ( P 0 ) , F z ( P 0 )) 为 π \pi π 在 P 0 P_0 P 0 的切平面法向量
r ⃗ ⋅ ( x ′ ( t 0 ) , y ′ ( t 0 ) , z ′ ( t 0 ) ) = 0 \vec{r} \cdot (x'(t_0), y'(t_0), z'(t_0)) = 0 r ⋅ ( x ′ ( t 0 ) , y ′ ( t 0 ) , z ′ ( t 0 )) = 0 为 L L L 在 P 0 P_0 P 0 的切线方向向量
有 r ⃗ ⋅ r ⃗ = 0 \vec{r} \cdot \vec{r} = 0 r ⋅ r = 0 ,即 L L L 在 P 0 P_0 P 0 的切线与 π \pi π 在 P 0 P_0 P 0 的切平面法向量垂直,从而定理成立
Fragment 6 极值
先讲讲水管(我一个朋友)的故事
教授:“一元函数驻点的定义是什么”
水管:“导数等于零”
教授:“那二元函数和一元函数的区别是什么(鼓励的语气)”
水管:“有两个未知数”
(最后水管劳斯想出了答案是偏导数存在且都等于 0 0 0 ,对面明显松了口气)
当然也说句实在话,让文科生学工科数学分析本身就是个很离谱的事情。
· 泰勒公式
“多元 Taylor 公式本质上没有给出新的内容,就是将多元的函数限制在一个直线上,然后给出一元的 Taylor 公式”
这部分的特点是复杂,但是没有什么新的东西
/Theorem/
设 D D D 是 R n \mathbb{R}^n R n 的开集, x ⃗ , y ⃗ ∈ D \vec{x}, \vec{y} \in D x , y ∈ D ,且线段 x ⃗ y ⃗ ⊆ D \vec{x}\vec{y} \subseteq D x y ⊆ D ,则对于 f ∈ C m ( D ) f \in C^m(D) f ∈ C m ( D ) 有:
f ( y ⃗ ) = f ( x ⃗ ) + 1 1 ! ∑ i = 1 m ∂ i f ( x ⃗ ) ( y i − x i ) + ⋯ + 1 ( m − 1 ) ! ∑ i 1 ⋯ ∑ i m − 1 ∂ i m − 1 ⋯ ∂ i 1 f ( x ⃗ ) ( y i 1 − x i 1 ) ⋯ ( y i m − 1 − x i m − 1 ) + 1 m ! ∑ i 1 ⋯ ∑ i m ∂ i m ⋯ ∂ i 1 f ( x ⃗ + θ ( y ⃗ − x ⃗ ) ) ( y i 1 − x i 1 ) ⋯ ( y i m − x i m ) \begin{align*}
f(\vec{y}) &= f(\vec{x}) + \frac{1}{1!} \sum_{i=1}^{m} \partial_i f(\vec{x})(y_i - x_i) + \cdots\\
&+ \frac{1}{(m-1)!} \sum_{i_1} \cdots \sum_{i_{m-1}} \partial_{i_{m-1}} \cdots \partial_{i_1} f(\vec{x})(y_{i_1} - x_{i_1}) \cdots (y_{i_{m-1}} - x_{i_{m-1}})\\
&+ \frac{1}{m!} \sum_{i_1} \cdots \sum_{i_m} \partial_{i_m} \cdots \partial_{i_1} f(\vec{x} + \theta(\vec{y} - \vec{x}))(y_{i_1} - x_{i_1}) \cdots (y_{i_m} - x_{i_m})
\end{align*}
f ( y ) = f ( x ) + 1 ! 1 i = 1 ∑ m ∂ i f ( x ) ( y i − x i ) + ⋯ + ( m − 1 )! 1 i 1 ∑ ⋯ i m − 1 ∑ ∂ i m − 1 ⋯ ∂ i 1 f ( x ) ( y i 1 − x i 1 ) ⋯ ( y i m − 1 − x i m − 1 ) + m ! 1 i 1 ∑ ⋯ i m ∑ ∂ i m ⋯ ∂ i 1 f ( x + θ ( y − x )) ( y i 1 − x i 1 ) ⋯ ( y i m − x i m )
实际使用中,我们用到的版本可能是 m = 1 m=1 m = 1 时的公式,也就是多元微分中值定理
/Corollary/
设 x y ⃗ ⊆ D \vec{xy} \subseteq D x y ⊆ D ,f ∈ C 1 ( D ) f \in C^1(D) f ∈ C 1 ( D ) ,则 ∃ 0 < θ < 1 \exists 0 < \theta < 1 ∃0 < θ < 1 使得
f ( y ⃗ ) = f ( x ⃗ ) + ∑ i = 1 n ∂ i f ( x ⃗ + θ ( y ⃗ − x ⃗ ) ) ( y i − x i ) = f ( x ⃗ ) + ( ∂ 1 f ⋯ ∂ n f ) ∣ x ⃗ + θ ( y ⃗ − x ⃗ ) ( y 1 − x 1 ⋮ y n − x n ) \begin{align*}
f(\vec{y}) &= f(\vec{x}) + \sum_{i=1}^{n} \partial_i f(\vec{x} + \theta(\vec{y} - \vec{x}))(y_i - x_i)
&= f(\vec{x}) + \left( \partial_1 f \cdots \partial_n f \right) \bigg|_{\vec{x} + \theta(\vec{y} - \vec{x})} \begin{pmatrix} y_1 - x_1 \\ \vdots \\ y_n - x_n \end{pmatrix}
\end{align*}
f ( y ) = f ( x ) + i = 1 ∑ n ∂ i f ( x + θ ( y − x )) ( y i − x i ) = f ( x ) + ( ∂ 1 f ⋯ ∂ n f ) x + θ ( y − x ) y 1 − x 1 ⋮ y n − x n
回忆 Jacobian:
J f ( u ⃗ ) = ( ∂ f ∂ x 1 ( u ⃗ ) ⋯ ∂ f ∂ x n ( u ⃗ ) ) 1 × n J_f(\vec{u}) = \begin{pmatrix} \frac{\partial f}{\partial x_1}(\vec{u}) & \cdots & \frac{\partial f}{\partial x_n}(\vec{u}) \end{pmatrix}_{1 \times n}
J f ( u ) = ( ∂ x 1 ∂ f ( u ) ⋯ ∂ x n ∂ f ( u ) ) 1 × n
因此喜欢线性代数的同学可以把微分中值写作
f ( y ⃗ ) = f ( x ⃗ ) + J f ( x ⃗ + θ ( y ⃗ − x ⃗ ) ) ( y ⃗ − x ⃗ ) f(\vec{y}) = f(\vec{x}) + J_f(\vec{x} + \theta(\vec{y} - \vec{x}))(\vec{y} - \vec{x})
f ( y ) = f ( x ) + J f ( x + θ ( y − x )) ( y − x )
与之前所说的 f f f 线性近似项 ⟷ f \longleftrightarrow f ⟷ f 的微分(其表示矩阵为 J f J_f J f )相互呼应。
f f f 可微:f ( y ) = f ( x ) + J f ( x ) ( y − x ) + o ( ∥ y − x ∥ ) f(y) = f(x) + J_f(x)(y - x) + o(\|y - x\|) f ( y ) = f ( x ) + J f ( x ) ( y − x ) + o ( ∥ y − x ∥ ) ;
微分中值:f ( y ) = f ( x ) + J f ( x + θ ( y − x ) ) ( y − x ) f(y) = f(x) + J_f(x + \theta(y - x))(y - x) f ( y ) = f ( x ) + J f ( x + θ ( y − x )) ( y − x ) 。
(感觉我们应该考不到这么离谱的地步吧)
· 无条件极值
以二元函数为例,若 P 0 ( x 0 , y 0 ) P_0(x_0, y_0) P 0 ( x 0 , y 0 ) 为 f ( x , y ) f(x, y) f ( x , y ) 的极值点
则 x 0 x_0 x 0 是一元函数 f ( x , y 0 ) f(x, y_0) f ( x , y 0 ) 的极值点,y 0 y_0 y 0 是一元函数 f ( x 0 , y ) f(x_0, y) f ( x 0 , y ) 的极值点,从而有定理
定理1(极值必要条件) :若 f f f 在 P 0 P_0 P 0 处存在对各变元的偏导数,且 P 0 P_0 P 0 是极值点,则 f f f 在 P 0 P_0 P 0 处对各变元的偏导数均为零,这样的点称为稳定点。
注意 :不是充分条件,例如 z = x 2 + y 2 z = \sqrt{x^2 + y^2} z = x 2 + y 2 在 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 取极小值,但偏导不存在。
Q. :设 y = f ( x , y ) y = f(x, y) y = f ( x , y ) ,P 0 ( x 0 , y 0 ) P_0(x_0, y_0) P 0 ( x 0 , y 0 ) 是稳定点,怎么判断 P 0 ( x 0 , y 0 ) P_0(x_0, y_0) P 0 ( x 0 , y 0 ) 是否是极值点?
考虑 f f f 的二阶泰勒公式(稳定点,线性项为零)
f ( x , y ) = f ( x 0 , y 0 ) + 1 2 ( Δ x , Δ y ) H f ( x 0 , y 0 ) ( Δ x Δ y ) + o ( ρ 2 ) f(x, y) = f(x_0, y_0) + \frac{1}{2} (\Delta x, \Delta y) H_f(x_0, y_0) \begin{pmatrix} \Delta x \\ \Delta y \end{pmatrix} + o(\rho^2)
f ( x , y ) = f ( x 0 , y 0 ) + 2 1 ( Δ x , Δ y ) H f ( x 0 , y 0 ) ( Δ x Δ y ) + o ( ρ 2 )
直观上,若黑塞矩阵 H f = [ f x x f x y f x y f y y ] H_f = \begin{bmatrix} f_{xx} & f_{xy} \\ f_{xy} & f_{yy} \end{bmatrix} H f = [ f xx f x y f x y f yy ] 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 处正定时
则 f f f 在 ( x 0 , y 0 ) (x_0, y_0) ( x 0 , y 0 ) 局部有 1 2 ( Δ x , Δ y ) H f ( x 0 , y 0 ) [ Δ x Δ y ] + o ( ρ 2 ) ≥ 0 \frac{1}{2} (\Delta x, \Delta y) H_f(x_0, y_0) \begin{bmatrix} \Delta x \\ \Delta y \end{bmatrix} + o(\rho^2) \geq 0 2 1 ( Δ x , Δ y ) H f ( x 0 , y 0 ) [ Δ x Δ y ] + o ( ρ 2 ) ≥ 0
从而 f ( x , y ) ≥ f ( x 0 , y 0 ) f(x, y) \geq f(x_0, y_0) f ( x , y ) ≥ f ( x 0 , y 0 ) ,P 0 ( x 0 , y 0 ) P_0(x_0, y_0) P 0 ( x 0 , y 0 ) 为极小值点
定理2 :设 f ( x 1 , … , x n ) f(x_1, \ldots, x_n) f ( x 1 , … , x n ) 在 P 0 ( x 1 ( 0 ) , … , x n ( 0 ) ) P_0(x_1^{(0)}, \ldots, x_n^{(0)}) P 0 ( x 1 ( 0 ) , … , x n ( 0 ) ) 的某邻域 U ( P 0 ) U(P_0) U ( P 0 ) 上具有二阶连续偏导数,且 P 0 P_0 P 0 是稳定点,则
若 H f ( P 0 ) H_f(P_0) H f ( P 0 ) 正定,则 P 0 P_0 P 0 是极小值点;
若 H f ( P 0 ) H_f(P_0) H f ( P 0 ) 负定,则 P 0 P_0 P 0 是极大值点;
若 H f ( P 0 ) H_f(P_0) H f ( P 0 ) 不定,则 P 0 P_0 P 0 不是极值点;
若 H f ( P 0 ) H_f(P_0) H f ( P 0 ) 半正定或半负定,则不能确定 P 0 P_0 P 0 是否为极值点。
鉴于线代还没讲到正定矩阵,先主要讨论二元函数的情况
当 n = 2 n = 2 n = 2 时,即 f ( x , y ) f(x, y) f ( x , y ) 为二元函数时,有如下判别法:
A = f x x ( P 0 ) B = f x y ( P 0 ) C = f y y ( P 0 ) A=f_{xx}(P_0)\quad \quad B=f_{xy}(P_0)\quad \quad C=f_{yy}(P_0)
A = f xx ( P 0 ) B = f x y ( P 0 ) C = f yy ( P 0 )
若 A > 0 A > 0 A > 0 且 ( A C − B 2 ) ( P 0 ) > 0 (AC - B^2)(P_0) > 0 ( A C − B 2 ) ( P 0 ) > 0 ,则 P 0 P_0 P 0 是极小值点;
若 A < 0 A < 0 A < 0 且 ( A C − B 2 ) ( P 0 ) > 0 (AC - B^2)(P_0) > 0 ( A C − B 2 ) ( P 0 ) > 0 ,则 P 0 P_0 P 0 是极大值点;
若 ( A C − B 2 ) ( P 0 ) < 0 (AC - B^2)(P_0) < 0 ( A C − B 2 ) ( P 0 ) < 0 ,则 P 0 P_0 P 0 不是极值点;
若 ( A C − B 2 ) ( P 0 ) = 0 (AC - B^2)(P_0) = 0 ( A C − B 2 ) ( P 0 ) = 0 ,则不能确定 P 0 P_0 P 0 是否为极值点。
· 最值
由有界闭集上连续函数的性质,若 f f f 在有界闭区域 D D D 上连续,则 f f f 在 D D D 取到最值
若最值点是 D D D 的内点则必是极值点,因此 f f f 的可能最值点是 f f f 的极值点和 D D D 的边界点
步骤一 :研究边界 ∂ D \partial D ∂ D 上 f f f 的取值,求出 M ∂ D M_{\partial D} M ∂ D 和 m ∂ D m_{\partial D} m ∂ D
步骤二 :求出所有稳定点和不可导点(通常有限个)P 1 , … , P n P_1, \ldots, P_n P 1 , … , P n
步骤三 :M = max { M ∂ D , f ( P 1 ) , … , f ( P n ) } M = \max\{M_{\partial D}, f(P_1), \ldots, f(P_n)\} M = max { M ∂ D , f ( P 1 ) , … , f ( P n )}
若 D D D 为无界区域,用有界闭区域逼近无界区域
命题 :若 f ( x , y ) f(x, y) f ( x , y ) 在 R 2 \mathbb{R}^2 R 2 连续,且 lim ρ → + ∞ f ( x , y ) = + ∞ \lim_{\rho \to +\infty} f(x, y) = +\infty lim ρ → + ∞ f ( x , y ) = + ∞ ,R = x 2 + y 2 R = \sqrt{x^2 + y^2} R = x 2 + y 2 ,则 f ( x , y ) f(x, y) f ( x , y ) 必有最小值。
取 M = f ( 0 , 0 ) M = f(0, 0) M = f ( 0 , 0 ) ,则 ∃ R 0 > 0 \exists R_0 > 0 ∃ R 0 > 0 ,使得 ∀ R ≥ R 0 \forall R \geq R_0 ∀ R ≥ R 0
有 f ( x , y ) ≥ f ( 0 , 0 ) f(x, y) \geq f(0, 0) f ( x , y ) ≥ f ( 0 , 0 ) ,x 2 + y 2 > R 2 x^2 + y^2 > R^2 x 2 + y 2 > R 2 ,特别地,在 x 2 + y 2 > R 0 2 x^2 + y^2 > R_0^2 x 2 + y 2 > R 0 2 成立
又 f f f 在有界闭区域 D R 0 = { x 2 + y 2 ≤ R 0 } D_{R_0} = \{x^2 + y^2 \leq R_0\} D R 0 = { x 2 + y 2 ≤ R 0 } 上连续,故必有最小值 m m m
而 ( 0 , 0 ) ∈ D R 0 (0, 0) \in D_{R_0} ( 0 , 0 ) ∈ D R 0 ,因此 m ≤ f ( 0 , 0 ) m \leq f(0, 0) m ≤ f ( 0 , 0 ) ,从而 m m m 是 f f f 在 R 2 \mathbb{R}^2 R 2 上的最小值
下面我们列举一些二元函数与一元函数不同的性质
问题1 :是否存在二元连续函数 f ( x , y ) f(x, y) f ( x , y ) 有无穷个极小值点,但无极大值点
E.G. :考虑 f ( x , y ) = x 2 f(x, y) = x^2 f ( x , y ) = x 2 ,则 ( 0 , y ) (0, y) ( 0 , y ) 都是极小值点
问题2 :若二元连续函数 f ( x , y ) f(x, y) f ( x , y ) 有唯一的极小值点,是否一定是最小值点?
反例 :f ( x , y ) = x 2 + y 2 ( 1 + x ) 2 f(x, y) = x^2 + y^2(1 + x)^2 f ( x , y ) = x 2 + y 2 ( 1 + x ) 2 在全平面连续
稳定点 f x = 2 x + 3 y 2 ( 1 + x ) 2 = 0 , f y = 2 y ( 1 + x ) 3 = 0 f_x = 2x + 3y^2(1 + x)^2 = 0, f_y = 2y(1 + x)^3 = 0 f x = 2 x + 3 y 2 ( 1 + x ) 2 = 0 , f y = 2 y ( 1 + x ) 3 = 0 ,则 ( x , y ) = ( 0 , 0 ) (x, y) = (0, 0) ( x , y ) = ( 0 , 0 )
用黑塞矩阵容易判别 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 为极小值点,然而
lim y → ∞ f ( − 2 , y ) = lim y → ∞ 4 − y 2 = − ∞ \lim_{y \to \infty} f(-2, y) = \lim_{y \to \infty} 4 - y^2 = -\infty
y → ∞ lim f ( − 2 , y ) = y → ∞ lim 4 − y 2 = − ∞
从而 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 不是最小值点
问题3 :任给方向 l ⃗ = ( α , β ) \vec{l} = (\alpha, \beta) l = ( α , β ) ,f ( α , β ) f(\alpha, \beta) f ( α , β ) 作为 f f f 的一元函数有极小值点 α = 0 \alpha = 0 α = 0 ,是否 ( 0 , 0 ) (0, 0) ( 0 , 0 ) 为 f ( x , y ) f(x, y) f ( x , y ) 的极小值点?
反例 :f ( x , y ) = ( y − x 2 ) ( y − 2 x 2 ) f(x, y) = (y - x^2)(y - 2x^2) f ( x , y ) = ( y − x 2 ) ( y − 2 x 2 )
· 条件极值
前面我们考虑了函数 f f f 在某区域 D D D 上的极值问题
但实际问题中,函数 f f f 的自变量往往受到其他条件的约束,称为条件极值问题
满足约束条件的极值点称为条件极值点
条件极值问题的一般形式为,求目标函数 f = ( x 1 , x 2 … , x n ) f = (x_1, x_2 \ldots, x_n) f = ( x 1 , x 2 … , x n )
在约束条件 g i ( x 1 , x 2 … , x n ) = 0 , i = 1 , 2 , … , m ( m < n ) g_i(x_1, x_2 \ldots, x_n) = 0, i = 1, 2, \ldots, m (m < n) g i ( x 1 , x 2 … , x n ) = 0 , i = 1 , 2 , … , m ( m < n ) 下的条件极值
当 m = 3 m = 3 m = 3 ,n = 2 n = 2 n = 2 时,目标函数 f ( x , y , z ) f(x, y, z) f ( x , y , z ) ,约束条件
{ g 1 ( x , y , z ) = 0 g 2 ( x , y , z ) = 0 \begin{cases}
g_1(x, y, z) = 0 \\
g_2(x, y, z) = 0
\end{cases}
{ g 1 ( x , y , z ) = 0 g 2 ( x , y , z ) = 0
设 ( x 0 , y 0 , z 0 ) (x_0, y_0, z_0) ( x 0 , y 0 , z 0 ) 是条件极值点,则首先要满足约束条件,即
{ g 1 ( x 0 , y 0 , z 0 ) = 0 g 2 ( x 0 , y 0 , z 0 ) = 0 \begin{cases}
g_1(x_0, y_0, z_0) = 0 \\
g_2(x_0, y_0, z_0) = 0
\end{cases}
{ g 1 ( x 0 , y 0 , z 0 ) = 0 g 2 ( x 0 , y 0 , z 0 ) = 0
这时候我们可以用 Language 乘数法(证明过程交给正在学习数学分析或高等微积分的同学)
上面的讨论说明:若 ( x 0 , y 0 , z 0 ) (x_0, y_0, z_0) ( x 0 , y 0 , z 0 ) 是条件极值点,且满足一定条件
则存在唯一的 λ 1 , λ 2 \lambda_1, \lambda_2 λ 1 , λ 2 使得方程组
{ f x ( x 0 , y 0 , z 0 ) + λ 1 g 1 x ( x 0 , y 0 , z 0 ) + λ 2 g 2 x ( x 0 , y 0 , z 0 ) = 0 f y ( x 0 , y 0 , z 0 ) + λ 1 g 1 y ( x 0 , y 0 , z 0 ) + λ 2 g 2 y ( x 0 , y 0 , z 0 ) = 0 f z ( x 0 , y 0 , z 0 ) + λ 1 g 1 z ( x 0 , y 0 , z 0 ) + λ 2 g 2 z ( x 0 , y 0 , z 0 ) = 0 g 1 ( x 0 , y 0 , z 0 ) = 0 g 2 ( x 0 , y 0 , z 0 ) = 0 \begin{cases}
f_x(x_0, y_0, z_0) + \lambda_1 g_{1x}(x_0, y_0, z_0) + \lambda_2 g_{2x}(x_0, y_0, z_0) = 0 \\
f_y(x_0, y_0, z_0) + \lambda_1 g_{1y}(x_0, y_0, z_0) + \lambda_2 g_{2y}(x_0, y_0, z_0) = 0 \\
f_z(x_0, y_0, z_0) + \lambda_1 g_{1z}(x_0, y_0, z_0) + \lambda_2 g_{2z}(x_0, y_0, z_0) = 0 \\
g_1(x_0, y_0, z_0) = 0 \\
g_2(x_0, y_0, z_0) = 0
\end{cases}
⎩ ⎨ ⎧ f x ( x 0 , y 0 , z 0 ) + λ 1 g 1 x ( x 0 , y 0 , z 0 ) + λ 2 g 2 x ( x 0 , y 0 , z 0 ) = 0 f y ( x 0 , y 0 , z 0 ) + λ 1 g 1 y ( x 0 , y 0 , z 0 ) + λ 2 g 2 y ( x 0 , y 0 , z 0 ) = 0 f z ( x 0 , y 0 , z 0 ) + λ 1 g 1 z ( x 0 , y 0 , z 0 ) + λ 2 g 2 z ( x 0 , y 0 , z 0 ) = 0 g 1 ( x 0 , y 0 , z 0 ) = 0 g 2 ( x 0 , y 0 , z 0 ) = 0
引入 Lagrange 函数 L ( x , y , z ) = f ( x , y , z ) + λ 1 g 1 ( x , y , z ) + λ 2 g 2 ( x , y , z ) L(x, y, z) = f(x, y, z) + \lambda_1 g_1(x, y, z) + \lambda_2 g_2(x, y, z) L ( x , y , z ) = f ( x , y , z ) + λ 1 g 1 ( x , y , z ) + λ 2 g 2 ( x , y , z )
容易验证,方程组转化为
{ L x = L y = L z = 0 g 1 ( x 0 , y 0 , z 0 ) = 0 g 2 ( x 0 , y 0 , z 0 ) = 0 \begin{cases}
L_x = L_y = L_z = 0 \\
g_1(x_0, y_0, z_0) = 0 \\
g_2(x_0, y_0, z_0) = 0
\end{cases}
⎩ ⎨ ⎧ L x = L y = L z = 0 g 1 ( x 0 , y 0 , z 0 ) = 0 g 2 ( x 0 , y 0 , z 0 ) = 0
以上讨论可以推广到任意的 m < n m < n m < n 的情形
Total 总结
偏导数连续 ⇒ \Rightarrow ⇒ 可微分 ⇒ \Rightarrow ⇒ 偏导数存在+函数连续
由于多元函数方向导数不同书目定义不同,这里暂不讨论