作者math1209 (.......................)
看板trans_math
标题极值判别法则 Part 1
时间Wed Dec 16 17:58:36 2009
※ 引述《midarmyman (midarmyman)》之铭言:
: 偏微分求极值时,判别式大於零之外,
: 还要看fxx如果>0就是极小,反之
: 请问为啥要看fxx不看fyy?
: 遇到一题变数不是x.y不知道该看哪个(不过都正)
[我先给 Part 1, 假使有必要後面还有 Part 2-5.]
以下将讲多变数函数世界里头的极值判别法则,而单变数中的极值判别法则相对於多变数
中的极值判别法则来的简单,故省略。
(引理) 命 f:S → |R, 其中 S is open in |R^n with a in S, 且 f 於 a 点有方向
导数。若 f(a) 为极值点,则
D_u f(a) = 0.
↓ kth component
特别地,选取 u = u_k = (0,...,1,...,0), 则 D_k f(a) = 0 for all
k = 1,2,...,n. 也就是说,此时 ▽f(a)=0.
因此,欲深究一内点 a 是否为极值点,我们就必须先假定 ▽f(a)=0. 再来回忆
f(a+k) = f(a) + ▽f(a).k + (1/2!) <Hk,k> + R_a,2(k),
其中 H = H(a), Hessian matrix of f at a.
NOTE. 只要谈论到极值问题往往就会涉及到泰勒定理(具备余项)。
(主定理)
假定 ▽f(a)=0, 即 a 点为 critical point, 且二阶偏导数 D_i,j f(x) 存在於
B(a), 且连续於 a 点上。
(1) 若 < Hk,k> 恒正 for all k ≠ 0, 则 f(a) 为 local minimum.
(2) 若 < Hk,k> 恒负 for all k ≠ 0, 则 f(a) 为 local maximum.
(3) 若 < Hk,k> 有正有负,则 a 点为 saddle point (鞍点)。
(鞍点定义) 若 a 为 critical point 且对於任意的 B(a) 中有点 x, y 使得
f(x) > f(a) 且 f(y) < f(a)
则称 a 点为鞍点。
由此可见,鞍点必定不是极值点。
Proof. 我们需要两个 lemmas:
(lemma 1) 若 H>0,则必存在一正数 c, 使得< Hk,k> ≧ c|k|^2 for all k.
(lemma 2) |R_a,2(k)|/|k|^2 → 0 as k→ 0.
由上述两引理,可证明此主定理。
NOTE.
(i) 由二阶偏导数 D_i,j f(x) 存在於 B(a), 且连续於 a 点上, 可知 H 为对称
矩阵,即 H^t = H.
(ii) 对一个对称矩阵 H 而言,
当 < Hk,k> 恒正 for all k ≠ 0, 我们称 H 为正定,且记为 H > 0.
当 < Hk,k> 恒负 for all k ≠ 0, 我们称 H 为负定,且记为 H < 0.
(正定原文为 positive definite, 负定原文为 negative definite.)
因此根据上述主定理可知:
当 a 为 critical point 时,且 Hessian matrix H(a) > 0 表示
f(a) 有局部极小。
简记为 {▽f(a) = 0} + {H(a) > 0} => f(a): local min.
当 a 为 critical point 时,且 Hessian matrix H(a) < 0 表示
f(a) 有局部极大。
简记为 {▽f(a) = 0} + {H(a) < 0} => f(a): local max.
(iii)
╭ D_11 f(a) ... D_1n f(a) ╮╭ k_1 ╮ ╭ k_1 ╮
<Hk,k> = < │ ... ... ... ││ . │ │ . │>
╰ D_n1 f(a) ... D_nn f(a) ╯╰ k_n ╯ ,╰ k_n ╯
n n
= Σ Σ D_ij f(a) k_i k_j.
i=1 j=1
即 H:|R^n→|R by H(k):= <Hk,k>. 如此之 H 称为二次型 (Quadratic form.)
(iv) 主定理告诉了我们一件重要的事情:在主定理的假设底下,余项对我们来说一
点也不重要,也就是说余项不会影响到函数本身的极值问题。即脑海要想着
f(a+k) ~ f(a) + (1/2!) <Hk,k> (因 ▽f(a) = 0)
这样一来,f(a+k) - f(a) ~ (1/2!) <Hk,k>.
因此,f(a+k) - f(a) 的正负可由 <Hk,k> 决定之。
(v) 最後提到一点线性代数,他将用在 Part 2 里头的推论 1.
对一个对称矩阵 H 而言:
H > 0 <=> H 的所有 eigenvalues 都必须恒正。
H < 0 <=> H 的所有 eigenvalues 都必须恒负。
--
Good taste, bad taste are fine, but you can't have no taste.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.133.4.14
1F:→ math1209:midarmyman 要问的东西在 Part 4. 220.133.4.14 12/16 18:01
2F:→ midarmyman:小弟知识浅薄 似乎不大懂 140.117.198.78 12/16 18:13
3F:→ midarmyman:不过还想请问如果两个变数不是x.y那要 140.117.198.78 12/16 18:14
4F:→ midarmyman:看哪个变数的二阶偏导数呢? 140.117.198.78 12/16 18:14
5F:→ math1209:不是这样说的...你得去看 Hessian Matrix 220.133.4.14 12/16 18:15
6F:→ math1209:只有双变数时, 这时候产生的 Hessian 220.133.4.14 12/16 18:16
7F:→ math1209:Matrix 是 2*2 矩阵. 因此此矩阵的正负定 220.133.4.14 12/16 18:16
8F:→ math1209:可以看出是为极值点... 220.133.4.14 12/16 18:17
9F:→ math1209:而你说的结论是正负定的 2x2 的特殊例子 220.133.4.14 12/16 18:17
10F:推 midarmyman:唉 线性代数现在才上到eigenvaluel 140.117.198.78 12/16 18:22
11F:→ midarmyman:那以後遇到这种怎办? 140.117.198.78 12/16 18:24
12F:→ math1209:遇到什麽? 看不懂就先背 2x2 的情况... 220.133.4.14 12/16 18:25
13F:→ math1209:我的记忆方法是直接看 y = x^2. 220.133.4.14 12/16 18:26
14F:→ math1209:这函数在 0 点导数是 0. 二阶导数为 2. 220.133.4.14 12/16 18:26
15F:→ math1209:因此这函数极小点发生在 x = 0. (事实上, 220.133.4.14 12/16 18:27
16F:→ math1209:是最小点.) 反之, y = -x^2 在原点产生 220.133.4.14 12/16 18:27
17F:→ math1209:极大点. 220.133.4.14 12/16 18:28
18F:→ midarmyman:我PO题目 140.117.198.78 12/16 18:31
19F:推 midarmyman:我写在原文了 140.117.198.78 12/16 18:37
20F:推 aacvbn:有神 快拜 163.22.18.76 12/16 22:03