无题

线性代数的核心内容是什么?

我们学习线性代数主要是为了解释三个问题:线性方程组解的存在性及表达;线性变换中的不变量(特征值);二次型曲面的分类

而其中对应着三种变换:等价变换;相似变换;合同变换。

也应用着矩阵的三种数值特征:行列式,秩(rank),特征值。

请注意,线性代数里面的很多东西是反常识的,但是都可以运用基本定理去加以证明,其中在线性代数中学到的很多证明都是粗糙的,因为缺乏线性映射和 λ\lambda - 矩阵等的知识。

Part 0 线性

线性代数的学习要求你必须知道线性是什么,尽管这放在一份线性代数期末复习笔记并不合适。

f(a+b)=f(a)+f(b)f(kx)=kf(x)f(a+b)=f(a)+f(b)\quad \quad f(kx)=kf(x)

以上就是以一种很直观的形式写出来了线性为何物。

Part 1 矩阵

请注意,我们来到了第一个问题:线性方程组的解,所以矩阵可以自然认定为方程组的系数。

虽然矩阵的很多东西实际上脱离了线性方程组的范畴,本文主要是为了简便。

· 基本运算

矩阵加减:请注意,矩阵的加减仅限定于形式相同的矩阵。

矩阵乘法:这也是矩阵运算的核心,需要强调一下

只有 AA 的列数 = BB 的行数, ABAB 才有意义

ABAB 的行数 = AA 的行数, ABAB 列数 = BB 的列数

Am×kBk×n(AB)m×nA_{m \times k} B_{k \times n} \longrightarrow (AB)_{m \times n}

ABAB 的第 (i,j)(i,j) 元素 = AA 的第 ii 行与 BB 的第 jj 列 对应元素乘积之和

矩阵乘法一般不满足交换律 \rightarrow 一般来说, 即使 ABAB, BABA 都有意义, 但 ABBAAB \neq BA

矩阵乘法一般来说, 不满足交换律

/property/

(1) 结合律: (AB)C=A(BC)(AB)C = A(BC)

(2) 分配律: (A+B)C=AC+BC(A+B)C = AC + BCA(B+C)=AB+ACA \cdot (B+C) = AB + AC

(3) 与数乘的相容性 c(AB)=(cA)B=A(cB)c \cdot (AB) = (c \cdot A)B = A(c \cdot B)

(4) 单位元: 设 Am×nA_{m \times n}, 则 ImA=A=AInI_m A = A = A I_n

对于矩阵乘方,有时候我们使用分块矩阵计算,有时候则用二项式展开

特别地: AIn=InA=AA \cdot I_n = I_n \cdot A = A

A(cIn)=(cIn)A=cAA (c I_n) = (c I_n) A = c A

(cIn+A)m=CmIn+Cm1cm1A++Cmm1cAm1+Am(c I_n + A)^m = C^m I_n + C_m^1 c^{m-1} A + \cdots + C_m^{m-1} c A^{m-1} + A^m

此时二项式展开不需要任何条件.

矩阵转置:矩阵转置实际上非常简单,我们只需要注意几条性质:

/property/

(1) ATT=AA^{TT} = A

(2) (A+B)T=AT+BT(A + B)^T = A^T + B^T

(3) (cA)T=cAT(c \cdot A)^T = c \cdot A^Tcc 是一个数

(4) (AB)T=BTAT(A \cdot B)^T = B^T \cdot A^T

(5) det(A)=det(AT)\det(A)=\det(A^T)

· 方阵的逆阵

注意,只有方阵才有逆矩阵,下面我们给出一些性质和证明

/property/

(i) 若 AA 可逆,则逆阵必唯一。

AA 有无逆阵不确定,但若存在必唯一)

(iii) 设 AA, BB 可逆,则 ABAB 也可逆,(AB)1=B1A1(AB)^{-1} = B^{-1}A^{-1}

(iii) 设 AA 可逆,c0c \neq 0 常数,则 cAcA 仍可逆(cA)1=c1A1(c \cdot A)^{-1} = c^{-1} A^{-1}

(iiii) 设 AA 可逆,则 AA' 也可逆且 (A)1=(A1)(A')^{-1} = (A^{-1})'

(v) 设 AA 可逆,则 (A1)1=A(A^{-1})^{-1} = A

(vi) 对可逆阵而言,乘法消去律成立

AA 为可逆:

{AB=AC    B=CBA=CA    B=C\begin{cases} AB = AC \implies B = C \\ BA = CA \implies B = C \end{cases}

(vii) 整性对可逆阵成立,即AA 可逆,

B0    AB0B \neq 0 \implies AB \neq 0

C0    CA0C \neq 0 \implies CA \neq 0

介绍完可逆矩阵性质,我们自然提出一个问题,怎么判断和求解矩阵逆阵?

于是就引入伴随矩阵:

/Define/

A=(aij)n×nA = (a_{ij})_{n \times n}AijA_{ij}aija_{ij}A|A| 中的代数余子式,则下列矩阵称为 AA 的伴随矩阵,记为 AA^*

A=[A11A21An1A12A22An2A1nA2nAnn]A^* = \begin{bmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & \ddots & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \end{bmatrix}

注意:AA 不一定有逆阵,但伴随阵一定存在。

通过代数余子式定义,( n1n-1 )阶行列式都可以计算,不依赖是否可逆

引理:设 AAnn 阶方阵,则 AA=AA=AInAA^* = A^*A = |A|I_n

定理:设 AAnn 阶方阵,若 A0|A| \neq 0,则 AA 可逆,且 A1=1AAA^{-1} = \frac{1}{|A|}A^*

定理: 设 A,BA, Bnn 阶方阵,则 AB=AB|AB| = |A||B|

定理:设 AAnn 阶方阵,则 AA 可逆 A0\Leftrightarrow |A| \neq 0

推论:

  1. A1,,AmA_1, \ldots, A_mnn 阶方阵,若 i\exists i 使 ii 是奇数,则 A1AmA_1 \cdots A_m 是奇异矩阵。

  2. AA 可逆,则 A1=A1|A^{-1}| = |A|^{-1}

  3. A,BA, Bnn 阶方阵,若 AB=InAB = I_n 并且 BA=InBA = I_n,则 B=A1B = A^{-1}

· 伴随矩阵性质

(1). AA=AA=AEAA^*=A^*A=|A|E

(2). (A)1=(A1)=1AA(A^*)^{-1}=(A^{-1})^*=\frac{1}{|A|}A

(3). (AB)=BA(AB)^*=B^*A^*

(4). (A)T=(AT)(A^*)^{T}=(A^{T})^*

(5). A=An1|A^*|=|A|^{n-1}

(6). (kA)=kn1A(kA)^*=k^{n-1}A^*

(7). (A)=An2A(A^*)^*=|A|^{n-2}A

· 矩阵初等变换

行列式性质:

A,BA, Bnn 阶方阵,cc 为常数。

  1. A+BA+B|A + B| \neq |A| + |B|

  2. cA=cnA|cA| = c^n|A|

  3. AB=AB|AB| = |A||B|

  4. AAT=A2|AA^T| = |A|^2

  5. AA 可逆,则 A1=1A|A^{-1}| = \frac{1}{|A|}

  6. n2n \geq 2,则 A=An1|A^{*}| = |A|^{n-1}

矩阵的初等变换

第一类:对换矩阵的两行(列)

第二类:矩阵某一行(列)乘上非零常数

第三类:矩阵某一行乘常数加到另一行上

我们假设原矩阵为 AA ,变换后矩阵为 BB ,则我们称 AABB 等价。

等价矩阵的性质我们一会再说。

而初等变换法求逆矩阵也是一个求解逆阵的好方法:

AAnn 阶非奇异矩阵,则存在初等矩阵 P1P_1 使得 P1PrA=InA1=PrP1P_1 \cdots P_r A = I_n \Rightarrow A^{-1} = P_r \cdots P_1

可以推出求逆矩阵方法:

[A:In][In:A1][A : I_n] \rightarrow [I_n : A^{-1}]

/proof/

(A:In)(PA:P1In)(PrP1A:PrP1In)(In:A1)(A : I_n) \rightarrow (PA : P_1 I_n) \rightarrow (P_r \cdots P_1 A : P_r \cdots P_1 I_n) \rightarrow (I_n : A^{-1})

列变换求逆矩阵:

[AIn]\begin{bmatrix} A \\ I_n \end{bmatrix}

这种方法的好处是计算量小。

· 分块矩阵

分块矩阵主要分为几个问题:行列式,逆阵,伴随矩阵

分块矩阵的行列式:

定理1

AAmm 阶方阵,BBm×nm \times n 阶矩阵,CCnn 阶矩阵,则

ABOC=AC.\begin{vmatrix} A & B \\ O & C \end{vmatrix} = |A||C|.

类似地行列式的形式为

AOBC\begin{vmatrix} A & O \\ B & C \end{vmatrix}

时,由行列式的转置值不变,因此仍有

AOBC=AC=AC.\begin{vmatrix} A' & O \\ B' & C' \end{vmatrix} = |A'||C'| = |A||C|.

定理2:

AABBCC 均为 nn 阶方阵,则

ABCO=(1)n2CB.\begin{vmatrix} A & B \\ C & O \end{vmatrix} = (-1)^{n^2}|C||B|.

其实 n2n^2 是因为 nnn\cdot n ,可以推广到两矩阵不同阶的情况。

定理3

P=[ABCD]P = \begin{bmatrix} A & B \\ C & D \end{bmatrix} 是分块 nn 阶矩阵,其中 AArr 阶方阵,BBr×sr \times s 阶矩阵,CCs×rs \times r 阶矩阵,DDss 阶方阵。

  1. AA 可逆,则 P=ADCA1B|P| = |A||D - CA^{-1}B|
  2. DD 可逆,则 P=DACD1B|P| = |D||A - CD^{-1}B|

定理4:

AABB 都是 nn 阶方阵,则有

ABBA=A+BAB.\begin{vmatrix} A & B \\ B & A \end{vmatrix} = |A + B||A - B|.

分块矩阵的逆矩阵:

(主不变,副对调,左乘同行右乘同列,再添负号)

(AOOB)1=(A1OOB1)\begin{pmatrix} A & O \\ O & B \end{pmatrix}^{-1} = \begin{pmatrix} A^{-1} & O \\ O & B^{-1} \end{pmatrix}

(AOCB)1=(A1OB1CA1B1)\begin{pmatrix} A & O \\ C & B \end{pmatrix}^{-1} = \begin{pmatrix} A^{-1} & O \\ -B^{-1}CA^{-1} & B^{-1} \end{pmatrix}

(ACOB)1=(A1A1CB1A1CB1OB1)\begin{pmatrix} A & C \\ O & B \end{pmatrix}^{-1} = \begin{pmatrix} A^{-1} - A^{-1}CB^{-1} & -A^{-1}CB^{-1} \\ O & B^{-1} \end{pmatrix}

(OABO)1=(OB1A1A1CB1)\begin{pmatrix} O & A \\ B & O \end{pmatrix}^{-1} = \begin{pmatrix} O & B^{-1} \\ A^{-1} & -A^{-1}CB^{-1} \end{pmatrix}

(CABO)1=(OB1A1A1CB1A1CB1)\begin{pmatrix} C & A \\ B & O \end{pmatrix}^{-1} = \begin{pmatrix} O & B^{-1} \\ A^{-1} - A^{-1}CB^{-1} & -A^{-1}CB^{-1} \end{pmatrix}

(OABC)1=(B1CA1B1A1O)\begin{pmatrix} O & A \\ B & C \end{pmatrix}^{-1} = \begin{pmatrix} -B^{-1}CA^{-1} & B^{-1} \\ A^{-1} & O \end{pmatrix}

分块矩阵的伴随主要还是利用以上两个部分以及公式求解。

· Rank

这部分主要讲矩阵的秩,秩可以表示方程组的有效方程数,也可表示非自由变量的数量。

AAm×nm \times n 矩阵,则:

(1). 0r(A)min{m,n}0 \leq r(A) \leq \min\{m, n\}\

(2). r(AT)=r(A)r(A^T) = r(A)

(3). 若 $A \neq 0 $,则 $ r(A) \geq 1$

(4). r(A±B)r(A)+r(B)r(A \pm B) \leq r(A) + r(B)

(5). 若 PP 可逆,则 r(PA)=r(A)r(PA) = r(A);若 QQ 可逆,则 r(AQ)=r(A)r(AQ) = r(A)

(6). r(AB)min{r(A),r(B)}r(AB) \leq \min\{r(A), r(B)\}

(7). r(AB)r(A)+r(B)nr(AB) \geq r(A) + r(B) - n

(8). 若 AB=0AB = 0,则 r(A)+r(B)nr(A) + r(B) \leq n

(9). AA 行满秩 r(A)=mA\Leftrightarrow r(A) = m \Leftrightarrow A 的等价标准形为 (Em,0)(E_m, 0)

(10). AA 列满秩 r(A)=nA\Leftrightarrow r(A) = n \Leftrightarrow A 的等价标准形为 (En0)\begin{pmatrix} E_n \\ 0 \end{pmatrix}

(11) 若 AAnn 阶方阵,则 r(A)=nA0r(A) = n \Leftrightarrow |A| \neq 0r(A)<nA=0r(A) < n \Leftrightarrow |A| = 0

(12) 同型矩阵 A,BA, B 等价的充要条件是 r(A)=r(B)r(A) = r(B)

(13) 设 AA^*nn 阶方阵 AA 的伴随矩阵,则

r(A)={n,if r(A)=n,1,if r(A)=n1,0,if r(A)<n1.r(A^*) = \begin{cases} n, & \text{if } r(A) = n, \\ 1, & \text{if } r(A) = n-1, \\ 0, & \text{if } r(A) < n-1. \end{cases}

Part 2 行列式

  • 上三角或者下三角行列式的值等于主对角线上元素的乘积

  • 行列式某行或某列全为零,则行列式值等于零

  • 行列式的某一行或某一列乘C,得到的值是原来行列式的C倍

  • 对换行列式里任意两行或两列后,新行列式的值为原行列式的相反数

  • 如果行列式有两行或两列成比例,那么该行列式值为0

  • 如果行列式里某一行或某一列的元素都可以拆成两个元素的和的话,那么这个行列式一定可以拆成两个行列式

  • 行列式的某一行乘以一个数加到另外一行上或者某一列乘以一个数加到另外一列上,行列式的值不改变

  • 行列式的转置和原行列式有相同的值

  • A=a1iA1i+a2iA2i+a3iA3i|A| = a_{1i}A_{1i} + a_{2i}A_{2i} + a_{3i}A_{3i}

    A=ai1Ai1+ai2Ai2+ai3Ai3|A| = a_{i1}A_{i1} + a_{i2}A_{i2} + a_{i3}A_{i3}

Part 3 向量

首先我们要知道什么是向量组线性相关和线性无关

· 线性关系

定义1 线性相关: KnK_n 中向量组 α1,α2,...,αs(s1)\alpha_1, \alpha_2, ..., \alpha_s (s \geq 1) 称为是线性相关的,如果 KK 中有不全为0的 k1,k2,...,ksk_1, k_2, ..., k_s 使得 k1α1+k2α2+...+ksαs=0k_1 \alpha_1 + k_2 \alpha_2 + ... + k_s \alpha_s = 0

定义2 线性无关: KnK_n 中如果有向量组 α1,α2,...,αs(s1)\alpha_1, \alpha_2, ..., \alpha_s (s \geq 1) 是线性无关的,那么从式子 k1α1+k2α2+...+ksαs=0k_1 \alpha_1 + k_2 \alpha_2 + ... + k_s \alpha_s = 0 中可以得到 k1=k2=...=ks=0k_1 = k_2 = ... = k_s = 0

· 结论

不妨设

α1=(a11,a12,,a1n)T,α2=(a21,a22,,a2n)T,,αm=(am1,am2,,amn)T,\alpha_1 = (a_{11}, a_{12}, \ldots, a_{1n})^T, \quad \alpha_2 = (a_{21}, a_{22}, \ldots, a_{2n})^T, \quad \ldots, \quad \alpha_m = (a_{m1}, a_{m2}, \ldots, a_{mn})^T,

β=(b1,b2,,bn)T,\beta = (b_1, b_2, \ldots, b_n)^T,

这里 $ m \leq n $。

(1). β\beta 可由 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性表示的充要条件是线性方程组 x1α1+x2α2++xmαm=βx_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_m \alpha_m = \beta 有解,即 Ax=bAx=b 有解:

(2). 向量组的秩:

① 令 A=(α1,α2,,αm)A = (\alpha_1, \alpha_2, \ldots, \alpha_m)B=(α1,α2,,αm,β)B = (\alpha_1, \alpha_2, \ldots, \alpha_m, \beta),则 β\beta 可由 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性表示的充要条件是以 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 为列向量的矩阵和以 α1,α2,,αm,β\alpha_1, \alpha_2, \ldots, \alpha_m, \beta 为列向量的矩阵有相同的秩,即 r(A)=r(B)r(A) = r(B)

β\beta 可由 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 唯一线性表示的充要条件是 r(A)=r(B)=mr(A) = r(B) = m

β\beta 不能由 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性表示的充要条件是 r(A)<r(B)r(A) < r(B)

(3). 向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性相关的充要条件是齐次线性方程组 Ax=0Ax=0 有非零解,且当 m=nm = n 时,其线性相关的充要条件是A=0.|A| = 0.

(4) 向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性无关的充要条件是齐次线性方程组 Ax=0Ax=0 只有零解。只有零解,且当 $ m = n $ 时,其线性无关的充要条件是 A0.|A| \neq 0.

(5) 向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性相关的充要条件是以 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 为列向量的矩阵的秩小于向量个数 mm

(6) 向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性无关的充要条件是以 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 为列向量的矩阵的秩等于向量个数 mm

(7) 向量组 α1,α2,,αm(m2)\alpha_1, \alpha_2, \ldots, \alpha_m (m \geq 2) 线性相关的充要条件是向量组中至少有一个向量是其余向量的线性组合;向量组 α1,α2,,αm(m2)\alpha_1, \alpha_2, \ldots, \alpha_m (m \geq 2) 线性无关的充要条件是向量组中任一个向量都不能由其余向量线性表示。

(8) 如果向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性无关,而向量组 α1,α2,,αm,β\alpha_1, \alpha_2, \ldots, \alpha_m, \beta 线性相关,则 β\beta 可以由 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性表示,且表达式唯一。

(9) 如果向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 可以由向量组 β1,β2,,βl\beta_1, \beta_2, \ldots, \beta_l 线性表示,并且 m>lm > l,则向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性相关;或者说,如果向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性无关,并且可以由 β1,β2,,βl\beta_1, \beta_2, \ldots, \beta_l 线性表示,则 mlm \leq l

(10) 在向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 中,如果有一个部分组线性相关,则整个向量组线性相关;如果整个向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性无关,则其任一部分组也一定线性无关。

(11) 设 rr 维向量组 αi=(ai1,ai2,,air)(i=1,2,,m)\alpha_i = (a_{i1}, a_{i2}, \ldots, a_{ir}) (i=1,2,\ldots,m) 线性无关,则在每个向量上再添加 nrn-r 个分量所得到的 nn 维向量组 αi=(ai1,ai2,,air,ai,r+1,,ain)(i=1,2,,m)\alpha'_i = (a_{i1}, a_{i2}, \ldots, a_{ir}, a_{i,r+1}, \ldots, a_{in}) (i=1,2,\ldots,m) 也线性无关。

(12) n+1n+1nn 维向量必线性相关。

(13) 一个零向量线性相关;一个非零向量线性无关;两个非零向量线性相关的充要条件是对应分量成比例;含有零向量的向量组必线性相关。

(14) 设 ε1=(1,0,,0)\varepsilon_1 = (1,0,\ldots,0)ε2=(0,1,,0)\varepsilon_2 = (0,1,\ldots,0)\ldotsεn=(0,0,,1)\varepsilon_n = (0,0,\ldots,1),称 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \ldots, \varepsilon_nnn 维单位向量组,且

ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \ldots, \varepsilon_n 线性无关;

② 任意 nn 维向量 α=(a1,a2,,an)\alpha = (a_1, a_2, \ldots, a_n) 都可由 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \ldots, \varepsilon_n 线性表示,即

α=a1ε1+a2ε2++anεn.\alpha = a_1 \varepsilon_1 + a_2 \varepsilon_2 + \cdots + a_n \varepsilon_n.

(15) 初等行变换不改变矩阵的列向量组之间的线性关系;初等列变换不改变矩阵的行向量组之间的线性关系。

· 极大无关组

设向量组 αi1,αi2,,αiv\alpha_{i_1}, \alpha_{i_2}, \ldots, \alpha_{i_v} 为向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 的一个部分组,且满足:

(1) αi1,αi2,,αiv\alpha_{i_1}, \alpha_{i_2}, \ldots, \alpha_{i_v} 线性无关;

(2) 向量组 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 中任一向量均可由 αi1,αi2,,αiv\alpha_{i_1}, \alpha_{i_2}, \ldots, \alpha_{i_v} 线性表示,则称向量组 αi1,αi2,,αiv\alpha_{i_1}, \alpha_{i_2}, \ldots, \alpha_{i_v}α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 的一个极大无关组。

· 向量组的秩

(1) 若 $ r(\alpha_1, \alpha_2, \ldots, \alpha_m) = r $,则

​ ① α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 的任何含有多于 rr 个向量的部分组一定线性相关;

​ ② α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 的任何含 rr 个向量的线性无关部分组一定是极大无关组。

(2) $ r(\alpha_1, \alpha_2, \ldots, \alpha_m) \leq m $,且 $ r(\alpha_1, \alpha_2, \ldots, \alpha_m) = m \Leftrightarrow \alpha_1, \alpha_2, \ldots, \alpha_m $ 线性无关。

(3) 向量 β\beta 可用 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 线性表示 r(α1,α2,,αm,β)=r(α1,α2,,αm)\Leftrightarrow r(\alpha_1, \alpha_2, \ldots, \alpha_m, \beta) = r(\alpha_1, \alpha_2, \ldots, \alpha_m)

(4) 向量 β\beta 可用 α1,α2,,αm\alpha_1, \alpha_2, \ldots, \alpha_m 唯一线性表示 r(α1,α2,,αm,β)=r(α1,α2,,αm)=m\Leftrightarrow r(\alpha_1, \alpha_2, \ldots, \alpha_m, \beta) = r(\alpha_1, \alpha_2, \ldots, \alpha_m) = m

(5) 向量组 β1,β2,,βt\beta_1, \beta_2, \ldots, \beta_t 可以用 α1,α2,,αs\alpha_1, \alpha_2, \ldots, \alpha_s 线性表示 r(α1,α2,,αs,β1,β2,,βt)=r(α1,α2,,αs)\Leftrightarrow r(\alpha_1, \alpha_2, \ldots, \alpha_s, \beta_1, \beta_2, \ldots, \beta_t) = r(\alpha_1, \alpha_2, \ldots, \alpha_s)

(6) 向量组 α1,α2,,αs\alpha_1, \alpha_2, \ldots, \alpha_sβ1,β2,,βt\beta_1, \beta_2, \ldots, \beta_t 等价 r(α1,α2,,αs)=r(β1,β2,,βt)\Leftrightarrow r(\alpha_1, \alpha_2, \ldots, \alpha_s) = r(\beta_1, \beta_2, \ldots, \beta_t)

(7) 若 β1,β2,,βt\beta_1, \beta_2, \ldots, \beta_t 可用 α1,α2,,αs\alpha_1, \alpha_2, \ldots, \alpha_s 线性表示,则

r(β1,β2,,βt)r(α1,α2,,αs).r(\beta_1, \beta_2, \ldots, \beta_t) \leq r(\alpha_1, \alpha_2, \ldots, \alpha_s).

(8) 设 AA 是一个 m×nm \times n 矩阵,记 α1,α2,,αn\alpha_1, \alpha_2, \ldots, \alpha_nAA 的列向量组 (mm 维),β1,β2,,βm\beta_1, \beta_2, \ldots, \beta_mAA 的行向量组 (nn 维),则 r(A)=r(α1,α2,,αn)=r(β1,β2,,βm)r(A) = r(\alpha_1, \alpha_2, \ldots, \alpha_n) = r(\beta_1, \beta_2, \ldots, \beta_m)

· 向量组等价

两个向量组能够相互线性表示,则称这两个向量组等价,结论如下:

(1) 任意向量组和它的极大无关组等价

(2) 向量组的任意两个极大无关组等价;

(3) 两个等价的线性无关的向量组所含向量的个数相同;向量组的一个极大无关组与其本身等价;

(4) 两个向量组等价的充要条件是它们的极大无关组等价;

(5) 等价的两个向量组有相同的秩。

· 向量空间

· 内积

给定 Rn\mathbb{R}^n 中的向量

α=(a1,a2,,an)T,β=(b1,b2,,bn)T,\alpha = (a_1, a_2, \ldots, a_n)^T, \quad \beta = (b_1, b_2, \ldots, b_n)^T,

则称 i=1naibi\sum_{i=1}^{n} a_i b_i 为向量 α\alphaβ\beta 的内积,记为 (α,β)(\alpha, \beta),即 (α,β)=αTβ=i=1naibi(\alpha, \beta) = \alpha^T \beta = \sum_{i=1}^{n} a_i b_i

内积具有下列性质:

(1) (α,β)=(β,α)(\alpha, \beta) = (\beta, \alpha)

(2) (kα,β)=k(α,β)(k\alpha, \beta) = k(\alpha, \beta)

(3) (α+β,γ)=(α,γ)+(β,γ)(\alpha + \beta, \gamma) = (\alpha, \gamma) + (\beta, \gamma)

(4) (α,α)0(\alpha, \alpha) \geq 0,当且仅当 α=0\alpha = 0 时,等号成立。

· 范数

α\alphaRn\mathbb{R}^n 中的任意向量,将非负实数 (α,α)\sqrt{(\alpha, \alpha)} 定义为 α\alpha 的长度,记为 α\|\alpha\|,即若 α=(a1,a2,,an)T\alpha = (a_1, a_2, \ldots, a_n)^T,则有

α=i=1nai2.\|\alpha\| = \sqrt{\sum_{i=1}^{n} a_i^2}.

向量的长度也称为向量的范数或模。

向量范数具有下列性质:

(1) α0\|\alpha\| \geq 0,当且仅当 α=0\alpha = 0 时,等号成立;

(2) 对于任意向量 α\alpha 和任意实数 kk,都有 kα=kα\|k\alpha\| = |k| \|\alpha\|

(3) 对于任意 nn 维向量 α\alphaβ\beta,有 α,β=αTβαβ|\langle \alpha, \beta \rangle| = |\alpha^T \beta| \leq \|\alpha\| \cdot \|\beta\|

· 正交向量

如果向量 α\alphaβ\beta 的内积等于零,即 α,β=0\langle \alpha, \beta \rangle = 0,则称 α\alphaβ\beta 相互正交。

如果非零向量组 α1,α2,,αs\alpha_1, \alpha_2, \ldots, \alpha_s 中的向量两两正交,即 αi,αj=0\langle \alpha_i, \alpha_j \rangle = 0ij,i,j=1,2,,si \neq j, i, j = 1, 2, \ldots, s),则称该向量组为正交向量组。

下面给出性质:

(1) 零向量与任何向量正交;

(2) 与自己正交的向量只有零向量;

(3) 正交向量组是线性无关的;

(4) 对任意向量 α\alphaβ\beta,有三角不等式

α+βα+β\|\alpha + \beta\| \leq \|\alpha\| + \|\beta\|

当且仅当 α\alphaβ\beta 相互正交时,有 α+β2=α2+β2\|\alpha + \beta\|^2 = \|\alpha\|^2 + \|\beta\|^2

· 向量空间

VV 是实数域 R\mathbf{R} 上的 nn 维向量组成的集合,如果 VV 关于向量的加法和数乘是封闭的,即

αV,βV\alpha \in V, \beta \in V,则 α+βV\alpha + \beta \in V;若 αV,kR\alpha \in V, k \in \mathbf{R},则 kαVk\alpha \in V,则称 VV 是实数域 R\mathbf{R} 上的向量空间。

· 坐标变换

在向量空间 Rn\mathbb{R}^n 中,nn 个线性无关的向量 ξ1,ξ2,,ξn\xi_1, \xi_2, \ldots, \xi_n 称为 Rn\mathbb{R}^n 的一组基。若 αRn\alpha \in \mathbb{R}^n 为任一向量,且

α=a1ξ1+a2ξ2++anξn,\alpha = a_1 \xi_1 + a_2 \xi_2 + \cdots + a_n \xi_n,

则称 a1,a2,,ana_1, a_2, \ldots, a_nα\alpha 关于基 ξ1,ξ2,,ξn\xi_1, \xi_2, \ldots, \xi_n 的坐标,记作 (a1,a2,,an)T(a_1, a_2, \ldots, a_n)^T

ξ1,ξ2,,ξn\xi_1, \xi_2, \ldots, \xi_nη1,η2,,ηn\eta_1, \eta_2, \ldots, \eta_nRn\mathbb{R}^n 的两组基,且有

(η1,η2,,ηn)=(ξ1,ξ2,,ξn)A,(\eta_1, \eta_2, \ldots, \eta_n) = (\xi_1, \xi_2, \ldots, \xi_n) A,

其中 AA 为由基 ξ1,ξ2,,ξn\xi_1, \xi_2, \ldots, \xi_n 到基 η1,η2,,ηn\eta_1, \eta_2, \ldots, \eta_n 的过渡矩阵,两个基之间的过渡矩阵是可逆矩阵。

αRn\alpha \in \mathbb{R}^n 在基 ξ1,ξ2,,ξn\xi_1, \xi_2, \ldots, \xi_n 和基 η1,η2,,ηn\eta_1, \eta_2, \ldots, \eta_n 下的坐标分别为 (x1,x2,,xn)T(x_1, x_2, \ldots, x_n)^T(y1,y2,,yn)T(y_1, y_2, \ldots, y_n)^T,则有

(x1x2xn)=A(y1y2yn)or(y1y2yn)=A1(x1x2xn).\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} = A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix} \quad \text{or} \quad \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix} = A^{-1} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}.

· 施密特正交化

向量空间 Rn\mathbb{R}^nnn 个向量 η1,η2,,ηn\eta_1, \eta_2, \cdots, \eta_n 满足:

(1) 两两正交,即 ηiTηj=0,ij,i,j=1,2,,n\eta_i^T \eta_j = 0, i \neq j, i,j=1,2,\cdots,n

(2) 都是单位向量,即 ηi=1,i=1,2,,n\|\eta_i\| = 1, i=1,2,\cdots,n

则称 η1,η2,,ηn\eta_1, \eta_2, \cdots, \eta_nRn\mathbb{R}^n 的一组标准正交基。

(1) 施密特正交化方法

给定一线性无关向量组 α1,α2,,αs\alpha_1, \alpha_2, \cdots, \alpha_s,由其生成等价的 ss 个向量的正交向量组 β1,β2,,βs\beta_1, \beta_2, \cdots, \beta_s 的公式如下:

β1=α1,β2=α2(α2,β1)(β1,β1)β1,β3=α3(α3,β1)(β1,β1)β1(α3,β2)(β2,β2)β2,βs=αs(αs,β1)(β1,β1)β1(αs,β2)(β2,β2)β2(αs,βs1)(βs1,βs1)βs1.\beta_1 = \alpha_1,\\ \beta_2 = \alpha_2 - \frac{(\alpha_2, \beta_1)}{(\beta_1, \beta_1)} \beta_1,\\ \beta_3 = \alpha_3 - \frac{(\alpha_3, \beta_1)}{(\beta_1, \beta_1)} \beta_1 - \frac{(\alpha_3, \beta_2)}{(\beta_2, \beta_2)} \beta_2,\\ \vdots\\ \beta_s = \alpha_s - \frac{(\alpha_s, \beta_1)}{(\beta_1, \beta_1)} \beta_1 - \frac{(\alpha_s, \beta_2)}{(\beta_2, \beta_2)} \beta_2 - \cdots - \frac{(\alpha_s, \beta_{s-1})}{(\beta_{s-1}, \beta_{s-1})} \beta_{s-1}.

(2) 给定 Rn\mathbb{R}^n 的任意一组基,把它变为标准正交基的步骤如下:

① 利用施密特正交化方法,由这组基生成有 nn 个向量的正交向量组;

② 把正交向量组中每个向量标准化,即单位化。

这样就得到 Rn\mathbb{R}^n 的一组标准正交基。这一过程称为标准正交化。

· 过渡矩阵

Rn\mathbb{R}^n 的两组标准正交基 ξ1,ξ2,,ξn\xi_1, \xi_2, \cdots, \xi_nη1,η2,,ηn\eta_1, \eta_2, \cdots, \eta_n 的过渡矩阵为 QQ,则存在下列关系

(ξ1,ξ2,,ξn)=(η1,η2,,ηn)Q,(\xi_1, \xi_2, \cdots, \xi_n) = (\eta_1, \eta_2, \cdots, \eta_n) Q,

QQ 满足 QTQ=EQ^T Q = E,即 QQ 为正交矩阵。

Part 4 方程组

· 齐次线性方程组

含有 nn 个未知数,mm 个一次方程的线性方程组一般有如下几种表示形式:

(1) 一般形式:

{a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2,am1x1+am2x2++amnxn=bm.\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2, \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m. \end{cases}

如果 $ b_1, b_2, \ldots, b_m $ 不全为零,则称为非齐次线性方程组。矩阵

A=(a11a12a1na21a22a2nam1am2amn)A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}

Aˉ=(a11a12a1nb1a21a22a2nb2am1am2amnbm)\bar{A} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{pmatrix}

分别称为非齐次线性方程组①的系数矩阵和增广矩阵。

如果线性方程组中的 $ b_1 = b_2 = \cdots = b_m = 0 $,即

{a11x1+a12x2++a1nxn=0,a21x1+a22x2++a2nxn=0,am1x1+am2x2++amnxn=0,\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = 0, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = 0, \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = 0, \end{cases}

则称为齐次线性方程组,并称②为①的导出组。

(2) 矩阵形式:非齐次线性方程组的矩阵形式:

Ax=b,Ax = b,

其中

x=(x1x2xn),b=(b1b2bm).x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}, \quad b = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{pmatrix}.

类似地,齐次线性方程组的矩阵形式:

Ax=0.Ax = 0.

(3) 向量形式:若系数矩阵按列分块为 $ A = (\alpha_1, \alpha_2, \cdots, \alpha_n) $,则非齐次线性方程组可写为

x1α1+x2α2++xnαn=b.x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n = b.

类似地,齐次线性方程组可写为

x1α1+x2α2++xnαn=0.x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n = 0.

· 解的性质和判定

(1) 如果 ξ1,ξ2,,ξs\xi_1, \xi_2, \ldots, \xi_s 是齐次线性方程组 Ax=0Ax = 0 的解,kk 为任意数,那么 kξ1,kξ2,,kξsk\xi_1, k\xi_2, \ldots, k\xi_s 都是该齐次线性方程组的解。因此 Ax=0Ax = 0 的解向量的线性组合仍是它的解向量。

(2) 设齐次线性方程组 Ax=0Ax = 0 含有 nn 个未知数和 mm 个方程,即系数矩阵 AAm×nm \times n 矩阵,则 Ax=0Ax = 0 有非零解的充要条件是:

r(A)<nr(A) < n;

AA 的列向量组线性相关;

AB=0AB = 0B0B \neq 0;

④ 当 m=nm = n 时,A=0|A| = 0.

亦即 Ax=0Ax = 0 只有零解的充要条件是

r(A)=nr(A) = n;

AA 的列向量组线性无关;

③ 当 m=nm = n 时,A0|A| \neq 0.

· 基础解系

(1) 设 ξ1,ξ2,,ξs\xi_1, \xi_2, \ldots, \xi_s 是齐次线性方程组 Ax=0Ax = 0 的解向量,如果

ξ1,ξ2,,ξs\xi_1, \xi_2, \ldots, \xi_s 线性无关;

② 方程组 Ax=0Ax = 0 的任意一个解向量都可由 ξ1,ξ2,,ξs\xi_1, \xi_2, \ldots, \xi_s 线性表示,

则称 ξ1,ξ2,,ξs\xi_1, \xi_2, \ldots, \xi_s 是齐次线性方程组 Ax=0Ax = 0 的一个基础解系。

(2) 设 Ax=0Ax = 0 含有 nn 个未知数,则基础解系所含解向量的个数为 nr(A)n - r(A),即自由未知量的个数。

(3) 若 ξ1,ξ2,,ξs\xi_1, \xi_2, \ldots, \xi_s 为齐次线性方程组 Ax=0Ax = 0 的一个基础解系,则 Ax=0Ax = 0 的任意一个解向量都可由它们线性表示:

k1ξ1+k2ξ2++ksξs,k_1 \xi_1 + k_2 \xi_2 + \cdots + k_s \xi_s,

称为齐次线性方程组 Ax=0Ax = 0 的通解(一般解或全部解),其中 k1,k2,,ksk_1, k_2, \ldots, k_s 为任意常数。

· 解空间

齐次线性方程组 Ax=0Ax = 0 的解向量的全体构成的向量空间,称为齐次线性方程组 Ax=0Ax = 0 的解空间。设 Ax=0Ax = 0 含有 nn 个未知数,则解空间的维数为 nr(A)n - r(A)

注意: 如无特别说明,我们总假设齐次线性方程组 Ax=0Ax = 0 含有 nn 个未知数和 mm 个方程,即系数矩阵 AAm×nm \times n 矩阵。

· 非齐次线性方程组

Ax=bAx = b 是含有 nn 个未知数、mm 个方程的非齐次线性方程组。

· 解的性质和判定

(1) 设 η1,η2\eta_1, \eta_2Ax=bAx = b 的两个解,则 η1η2\eta_1 - \eta_2 是其导出组 Ax=0Ax = 0 的解;

(2) 设 η\etaAx=bAx = b 的解,ξ\xi 是其导出组 Ax=0Ax = 0 的解,则 η+ξ\eta + \xiAx=bAx = b 的解;

(3) 设 A=(α1,α2,,αn)A = (\alpha_1, \alpha_2, \ldots, \alpha_n)Aˉ=(α1,α2,,αn,b)\bar{A} = (\alpha_1, \alpha_2, \ldots, \alpha_n, b) 分别是 Ax=bAx = b 的系数矩阵和增广矩阵,则 Ax=bAx = b 有解的充要条件是:

r(A)=r(Aˉ)r(A) = r(\bar{A}),即系数矩阵的秩与增广矩阵的秩相同;

bb 可由 α1,α2,,αn\alpha_1, \alpha_2, \ldots, \alpha_n 线性表示;

③ 向量组 α1,α2,,αn\alpha_1, \alpha_2, \ldots, \alpha_nα1,α2,,αn,b\alpha_1, \alpha_2, \ldots, \alpha_n, b 等价;

r(α1,α2,,αn)=r(α1,α2,,αn,b)r(\alpha_1, \alpha_2, \ldots, \alpha_n) = r(\alpha_1, \alpha_2, \ldots, \alpha_n, b).

(4) Ax=bAx = b 无解的充要条件是

r(A)r(Aˉ)r(A) \neq r(\bar{A}),即 r(A)+1=r(Aˉ)r(A) + 1 = r(\bar{A}); ② bb 不能由 α1,α2,,αn\alpha_1, \alpha_2, \ldots, \alpha_n 唯一线性表示; ③ 当 m=nm = n 时,A0|A| \neq 0.

(5) Ax=bAx = b 有唯一解的充要条件是

r(A)=r(Aˉ)=nr(A) = r(\bar{A}) = n; ② bb 可由 α1,α2,,αn\alpha_1, \alpha_2, \ldots, \alpha_n 唯一线性表示; ③ 当 m=nm = n 时,A0|A| \neq 0.

(6) Ax=bAx = b 有无穷多解的充要条件是

r(A)=r(Aˉ)<nr(A) = r(\bar{A}) < n; ② bb 可由 α1,α2,,αn\alpha_1, \alpha_2, \ldots, \alpha_n 线性表示,但表示法不唯一; ③ 当 m=nm = n 时,A=0|A| = 0.

· 通解

对非齐次线性方程组 Ax=bAx = b,若 r(A)=r(Aˉ)=rr(A) = r(\bar{A}) = r,且 η\etaAx=bAx = b 的一个解,ξ1,ξ2,,ξnr\xi_1, \xi_2, \ldots, \xi_{n-r} 是其导出组 Ax=0Ax = 0 的一个基础解系,则 Ax=bAx = b 的通解(全部解)为

η+k1ξ1+k2ξ2++knrξnr,\eta + k_1\xi_1 + k_2\xi_2 + \cdots + k_{n-r}\xi_{n-r},

其中 k1,k2,,knrk_1, k_2, \ldots, k_{n-r} 为任意常数。

· 线性方程组性质

· 线性方程组的同解性

线性方程组有下列三种变换,称为线性方程组的初等变换:

(1) 换法变换:交换某两个方程的位置;

(2) 倍法变换:某个方程的两端同乘以一个非零常数;

(3) 消法变换:把一个方程的若干倍加到另一个方程上去。

在线性方程组的三种初等变换之下,线性方程组的同解性不变。

· 常见的同解方程组形式

(1) 设 AAm×nm \times n 矩阵,PPmm 阶可逆矩阵,则 Ax=0Ax = 0PAx=0PAx = 0 为同解方程组;

(2) 设 AAnn 阶实矩阵,ATA^T 为矩阵 AA 的转置,则 Ax=0Ax = 0ATAx=0A^TAx = 0 为同解方程组;

(3) 设 AAnn 阶实对称矩阵,则 Ax=0Ax = 0A2x=0A^2x = 0 为同解方程组。

· 方程组的公共解

(1) 由通解表达式相等求公共解:此类题目一般所给条件为方程组 (I) 的基础解系及方程组 (II) 的一般表示式。这时一般只需把方程组 (I) 的通解代入方程组 (II) 即可。

(2) 由两个方程组合并为一个新的方程组求公共解:此类题目一般所给条件为方程组 (I)、(II) 的一般表示式。这时只需把两个方程组合并为方程组 (III),则方程组 (III) 的通解即为方程组 (I)、(II) 的公共解。

Part 5 相似

· 特征值

AAnn阶矩阵,λ\lambda是一个数,若存在一个nn维非零列向量xx,使Ax=λxAx = \lambda x成立,则称λ\lambdaAA的一个特征值,相应的非零列向量xx称为AA的属于λ\lambda的特征向量。

λEA\lambda E - A称为AA的特征矩阵,λEA|\lambda E - A|称为AA的特征多项式,λEA=0|\lambda E - A| = 0称为AA的特征方程。

· 特征值的性质及运算

λ\lambdann阶矩阵AA的特征值,则:

(1)kλk\lambdakAkA的特征值。

(2)λm\lambda^mAmA^m的特征值。

(3)f(A)=i=0maiAif(A) = \sum_{i=0}^{m} a_i A^i的特征值为f(λ)=i=0maiλif(\lambda) = \sum_{i=0}^{m} a_i \lambda^i

(4) 若AA可逆,则λ0\lambda \neq 0,且1λ\frac{1}{\lambda}A1A^{-1}的特征值。

(5) 若λ0\lambda \neq 0,则AA^*有特征值Aλ\frac{|A|}{\lambda}

(6)AAATA^T有相同的特征值。

(7)ABABBABA有相同的特征值。

(8) 0 是AA的特征值的充要条件是A=0|A| = 0,亦即AA可逆的充要条件是AA的所有特征值全不为零。

(9) 零矩阵有nn重特征值 0。

(10) 单位矩阵有nn重特征值 1。

(11) 数量矩阵kEkEnn重特征值kk

(12) 幂零矩阵 (Am=0A^m = 0) 有nn重特征值 0。

(13) 幂等矩阵 (A2=AA^2 = A) 的特征值只可能是 0 或 1。

(14) 对合矩阵 (A2=EA^2 = E) 的特征值只可能是 1 或 -1。

(15)kk-幂矩阵 (Ak=EA^k = E) 的特征值只可能是 1 的kk次方根。

(16) 设A=(aij)n×nA = (a_{ij})_{n×n}nn个特征值为λ1,λ2,,λn\lambda_1, \lambda_2, \ldots, \lambda_n,则:

λ1+λ2++λn=a11+a22++ann\lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{22} + \cdots + a_{nn},即特征值之和等于矩阵的迹;

λ1λ2λn=A\lambda_1 \lambda_2 \cdots \lambda_n = |A|,即特征值之积等于矩阵的行列式。

· 特征向量性质

(1) 若 xxAA 的属于特征值 λ\lambda 的特征向量,则 xx 一定是非零向量。

(2) 若 x1,x2,,xmx_1, x_2, \ldots, x_m 都是 AA 的属于同一特征值 λ\lambda 的特征向量,且 k1x1+k2x2++kmxm0k_1 x_1 + k_2 x_2 + \cdots + k_m x_m \neq 0,则 k1x1+k2x2++kmxmk_1 x_1 + k_2 x_2 + \cdots + k_m x_m 也是 AA 的属于特征值 λ\lambda 的特征向量。

(3) 设 λ1,λ2\lambda_1, \lambda_2AA 的两个不同特征值,x1,x2x_1, x_2AA 的分别属于 λ1,λ2\lambda_1, \lambda_2 的特征向量,则 x1+x2x_1 + x_2 不是 AA 的特征向量。

(4) 若 λ\lambdaAArr 重特征值,则属于 λ\lambda 的线性无关的特征向量最多有 rr 个。

(5) AA 的属于不同特征值对应的特征向量线性无关。

(6) 设 λ\lambdaAA 的特征值,xx 是属于 λ\lambda 的特征向量,则:

​ ① xxkAkA 的属于特征值 kλk\lambda 的特征向量,也是 AmA^m 的属于特征值 λm\lambda^m 的特征向量;还是 f(A)=i=0maiAif(A) = \sum_{i=0}^{m} a_i A^i 的属于特征值 f(λ)=i=0maiλif(\lambda) = \sum_{i=0}^{m} a_i \lambda^i 的特征向量;

​ ② 若 λ0\lambda \neq 0,则 xx 也是 A1A^{-1} 的属于特征值 1λ\frac{1}{\lambda} 的特征向量,也是 AA^* 的属于特征值 Aλ\frac{|A|}{\lambda} 的特征向量;

​ ③ 若 B=P1APB = P^{-1}APPP 为可逆矩阵,则 λ\lambdaBB 的特征值,且 P1xP^{-1}xBB 的属于特征值 λ\lambda 的特征向量。

· 特征值和特征向量求法

(1) 对于数字型矩阵AA,其特征值和特征向量的求法如下:

① 计算特征多项式λEA|\lambda E - A|

② 求解特征方程λEA=0|\lambda E - A| = 0,其所有根λ1,λ2,,λn\lambda_1, \lambda_2, \ldots, \lambda_n即为AA的全部特征值;

③ 固定一个特征值λ\lambda,解齐次线性方程组(λEA)x=0(\lambda E - A)x = 0,得基础解系为η1,η2,,ηs\eta_1, \eta_2, \ldots, \eta_ss=nr(λEA)s = n - r(\lambda E - A),则AA的属于λ\lambda的所有特征向量为k1η1+k2η2++ksηsk_1 \eta_1 + k_2 \eta_2 + \cdots + k_s \eta_s,其中k1,k2,,ksk_1, k_2, \ldots, k_s不全为零。

(2) 对于抽象型矩阵AA,其特征值和特征向量的求法通常有两种思路:

① 利用特征值和特征向量的定义,若数λ\lambda和非零向量xx满足Ax=λxAx = \lambda x,则λ\lambdaAA的特征值,xxAA的属于λ\lambda的特征向量;

② 利用特征值和特征向量的性质,例如已知AA的特征值,便可求得kA,Am,i=0maiAikA, A^m, \sum_{i=0}^{m} a_i A^i等矩阵的特征值。

· 矩阵相似

A,BA, Bnn阶矩阵,若存在可逆矩阵PP,使P1AP=BP^{-1}AP = B,则称BBAA的相似矩阵,或称AABB相似,记为ABA \sim B

· 矩阵相似的性质

(1) 若ABA \sim B,BCB \sim C,则ACA \sim C

(2) 若ABA \sim B,则kAkBkA \sim kBAmBmA^m \sim B^m,进而f(A)=i=0maiAif(B)=i=0maiBif(A) = \sum_{i=0}^{m} a_i A^i \sim f(B) = \sum_{i=0}^{m} a_i B^i

f(A)=i=0maiAif(B)=i=0maiBi.f(A) = \sum_{i=0}^{m} a_i A^i \sim f(B) = \sum_{i=0}^{m} a_i B^i.

(3) 若ABA \sim B,则ATBTA^T \sim B^TA1B1A^{-1} \sim B^{-1}ABA^* \sim B^*A+kEB+kEA + kE \sim B + kEkk为常数)。

(4) 若ABA \sim B,则A=B|A| = |B|r(A)=r(B)r(A) = r(B)

(5) 设A=(aij)A = (a_{ij})B=(bij)B = (b_{ij}),若ABA \sim B,则i=1naii=i=1nbii\sum_{i=1}^{n} a_{ii} = \sum_{i=1}^{n} b_{ii},即A,BA, B有相同的迹。

(6) 若ABA \sim B,则λEA=λEB|\lambda E - A| = |\lambda E - B|,即A,BA, B有相同的特征值。

(7) 零矩阵、单位矩阵、数量矩阵只与自己相似。

(2)~(6) 只是矩阵相似的必要条件。

· 对角化

AAnn 阶矩阵,若存在可逆矩阵 PP,使 P1APP^{-1}AP 为对角矩阵,则称 AA 可相似对角化。

(1) 矩阵 AA 可相似对角化的充要条件是 AAnn 个线性无关的特征向量;

(2) 矩阵 AA 可相似对角化的充要条件是对 AA 的任意特征值 λ\lambda,属于 λ\lambda 的线性无关的特征向量的个数等于 λ\lambda 的重数,亦即 $n - r(\lambda E - A) $ 等于 $ \lambda$ 的重数;

(3) 矩阵 $ A $ 可相似对角化的充分条件是 $ A $ 有 $ n $ 个互不相同的特征值。

· 相似对角化步骤

(1) 解特征方程λEA=0|\lambda E - A| = 0,求出所有特征值;

(2) 对于不同的特征值λ\lambda,解方程组(λEA)x=0(\lambda E - A)x = 0,求出基础解系,如果每一个λ\lambda的重数等于基础解系中向量的个数,则AA可对角化,否则,AA不可对角化;

(3) 若AA可对角化,设所有线性无关的特征向量为ξ1,ξ2,,ξn\xi_1, \xi_2, \ldots, \xi_n,则所求的可逆矩阵P=(ξ1,ξ2,,ξn)P = (\xi_1, \xi_2, \ldots, \xi_n),并且有P1AP=ΛP^{-1}AP = \Lambda,其中

Λ=(λ1λ2λn)\Lambda = \begin{pmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}

注意:Λ\Lambda的主对角线元素为AA的全部特征值,其排列顺序与PP中列向量的排列顺序对应。

· 实对称阵相似

AA是实对称矩阵,则

(1)AA的特征值为实数,AA的特征向量为实向量。

(2)AA的不同特征值所对应的特征向量正交。

(3)AAkk重特征值所对应的线性无关的特征向量恰有kk个。

(4)AA相似于对角矩阵,且存在正交矩阵QQ,使

Q1AQ=QTAQ=(λ1λ2λn)Q^{-1}AQ = Q^T AQ = \begin{pmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}

其中λ1,λ2,,λn\lambda_1, \lambda_2, \ldots, \lambda_nAA的特征值。

(5) 实对称矩阵AABB相似的充要条件是AABB有相同的特征值。

· 步骤

(1) 求出矩阵AA的全部特征值λ1,λ2,,λs\lambda_1, \lambda_2, \ldots, \lambda_s,其中λ1,λ2,,λs\lambda_1, \lambda_2, \ldots, \lambda_s的重数分别为k1,k2,,ksk_1, k_2, \ldots, k_s

(2) 对每个kik_i重特征值λi\lambda_i,求方程组(λiEA)x=0(\lambda_i E - A)x = 0的基础解系,得kik_i个线性无关的特征向量。再把它们正交化、单位化,得kik_i个两两正交的单位特征向量。因k1++ki=nk_1 + \cdots + k_i = n,故总共可得nn个两两正交的单位特征向量。

(3) 把这nn个两两正交的单位特征向量构成正交矩阵QQ,便有Q1AQ=QTAQ=ΛQ^{-1}AQ = Q^T AQ = \Lambda。注意Λ\Lambda中对角元的排列次序应与QQ中列向量的排列次序相对应。

Part 6 合同

· 二次型

(1) 含有 nn 个变量 x1,x2,,xnx_1, x_2, \cdots, x_n 的二次齐次函数

f(x1,x2,,xn)=a11x12+a22x22++annxn2+2a12x1x2+2a13x1x3++2an1,nxn1xn f(x_1, x_2, \cdots, x_n) = a_{11}x_1^2 + a_{22}x_2^2 + \cdots + a_{nn}x_n^2 + 2a_{12}x_1x_2 + 2a_{13}x_1x_3 + \cdots + 2a_{n-1,n}x_{n-1}x_n

称为 nn 元二次型。

(2) 二次型有矩阵表示

f(x1,x2,,xn)=xTAx f(x_1, x_2, \cdots, x_n) = x^T A x

其中 x=(x1,x2,,xn)Tx = (x_1, x_2, \cdots, x_n)^T,$ A = (a_{ij})$,且 AT=AA^T = A 是对称矩阵,称 AA 为二次型的矩阵。r(A)r(A) 称为二次型的秩,记为 r(f)r(f)

(3) 如果二次型中只含有变量的平方项,所有混合项 xixj(ij)x_i x_j (i \neq j) 的系数全是零,即

xTAx=d1x12+d2x22++dnxn2 x^T A x = d_1 x_1^2 + d_2 x_2^2 + \cdots + d_n x_n^2

这样的二次型称为标准形。

在标准形中,如平方项的系数 did_i 为 1, -1 或 0,

xTAx=x12+x22++xp2xp+12xp+q2 x^T A x = x_1^2 + x_2^2 + \cdots + x_p^2 - x_{p+1}^2 - \cdots - x_{p+q}^2

则称其为二次型的规范形。

(4) 在二次型 xTAxx^T A x 的规范形中,正的平方项的个数 pp 称为二次型的正惯性指数,负的平方项的个数 qq 称为二次型的负惯性指数;正负惯性指数之差 pqp - q 称为二次型的符号差。

(5) 如果

{x1=c11y1+c12y2++c1nyn,x2=c21y1+c22y2++c2nyn,xn=cn1y1+cn2y2++cnnyn\begin{cases} x_1 = c_{11} y_1 + c_{12} y_2 + \cdots + c_{1n} y_n, \\ x_2 = c_{21} y_1 + c_{22} y_2 + \cdots + c_{2n} y_n, \\ \vdots \\ x_n = c_{n1} y_1 + c_{n2} y_2 + \cdots + c_{nn} y_n \end{cases}

满足

C=c11c12c1nc21c22c2ncn1cn2cnn0,|C| = \begin{vmatrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \end{vmatrix} \neq 0,

称①为由 x=(x1,x2,,xn)Tx = (x_1, x_2, \ldots, x_n)^Ty=(y1,y2,,yn)Ty = (y_1, y_2, \ldots, y_n)^T 的非退化线性替换,且①可用矩阵描述,即

(x1x2xn)=(c11c12c1nc21c22c2ncn1cn2cnn)(y1y2yn),\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} c_{11} & c_{12} & \cdots & c_{1n} \\ c_{21} & c_{22} & \cdots & c_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ c_{n1} & c_{n2} & \cdots & c_{nn} \end{pmatrix} \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix},

x=Cyx = Cy,其中 CC 是可逆矩阵。

注意: 如果没有特别说明,本章所涉及的二次型均为实二次型,即二次型中变量的系数均为实数,所涉及的矩阵和向量都是实的。

· 常用结论

(1) 二次型与对称矩阵一一对应。

(2) 变量x=(x1,x2,,xn)Tx = (x_1, x_2, \ldots, x_n)^Tnn元二次型xTAxx^T A x经过非退化线性替换x=Cyx = Cy后,成为变量y=(y1,y2,,yn)Ty = (y_1, y_2, \ldots, y_n)^Tnn元二次型yTByy^T B y,其中B=CTACB = C^T A C

(3) 任意的nn元二次型xTAxx^T A x都可以通过非退化线性替换化成标准形d1y12+d2y22++dnyn2d_1 y_1^2 + d_2 y_2^2 + \cdots + d_n y_n^2,其中di(i=1,2,,n)d_i (i = 1, 2, \ldots, n)是实数。

(4) 惯性定理 任意nn元二次型xTAxx^T A x都可以通过非退化线性替换化为规范形z12+z22++zp2zp+12zp+q2z_1^2 + z_2^2 + \cdots + z_p^2 - z_{p+1}^2 - \cdots - z_{p+q}^2,其中pp为正惯性指数,qq为负惯性指数,p+qp + q为二次型的秩,且p,qp, q由二次型唯一确定,即规范形是唯一的。

(5) 任意nn元二次型xTAxx^T A x,由于AA是实对称矩阵,故必存在正交变换x=Qyx = Q yQQ为正交矩阵),使得二次型化为标准形λ1y12+λ2y22++λnyn2\lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2,且λ1,λ2,,λn\lambda_1, \lambda_2, \ldots, \lambda_nAAnn个特征值。

(6) 非退化线性替换保持二次型的正负惯性指数、秩、正定性等。

· 正定

(1). 基本概念

如果实二次型f(x1,x2,,xn)f(x_1, x_2, \ldots, x_n)对任意一组不全为零的实数x1,x2,,xnx_1, x_2, \ldots, x_n,都有f(x1,x2,,xn)>0f(x_1, x_2, \ldots, x_n) > 0,则称该二次型为正定二次型,正定二次型的矩阵称为正定矩阵。正定二次型与正定矩阵一一对应。

(2). 实对称矩阵正定性的判定

AAnn阶实对称矩阵,则下列命题等价:

(1)AA是正定矩阵。

(2)xTAxx^T A x的正惯性指数p=np = n

(3)AA的顺序主子式大于 0。

(4)AA的所有主子式大于 0。

(5)AA合同于单位矩阵EE

(6)AA的特征值全大于 0。

(7) 存在可逆矩阵PP,使A=PTPA = P^T P

(8) 存在非退化的上(下)三角形矩阵QQ,使A=QTQA = Q^T Q

· 性质

(1) 若AA为正定矩阵,则A>0|A| > 0AA为可逆对称矩阵。

(2) 若AA为正定矩阵,则AA的主对角线元素aii>0a_{ii} > 0i=1,2,,ni = 1, 2, \ldots, n)。

(3) 若AA为正定矩阵,则A1,kAA^{-1}, kAk>0k > 0为实数)均为正定矩阵。

(4) 若AA为正定矩阵,则AmA^m(其中mm为正整数)均为正定矩阵。

(5) 若A,BA, B均为nn阶正定矩阵,则A+BA + B也是正定矩阵。

· 合同

A,BA, B为两个方阵,若存在可逆矩阵CC,使B=CTACB = C^T A C成立,则称AABB合同。

(1) 若AA为正定矩阵,则A>0|A| > 0AA为可逆对称矩阵。

(2) 矩阵AABB合同的充要条件是对AA的行和列施以相同的初等变换变成BB

(3) 设AABB是实对称矩阵,

AABB合同的充要条件是二次型xTAxx^T A xxTBxx^T B x有相同的正负惯性指数。

(4)AABB合同的充分条件是AABB相似。