特征值和特征向量 也是方阵的一个属性,它们是把一个矩阵当作变换 作用来看的时候这个矩阵所拥有的一些 “特征”,这些“特征”由特征值和特征向量所反映。
对于一个变换矩阵 A = [ 4 − 2 1 1 ] A= \begin{bmatrix} 4&-2 \\ 1&1 \end{bmatrix} A=[41−21],当左乘一个向量 u ⃗ \vec u u的时候, A ⋅ u ⃗ = u ⃗ ′ A \cdot \vec u =\vec u^{'} A⋅u=u′表示把向量从一个位置转换到空间的另一个位置,这个过程从空间的基来理解的话则表示矩阵 A A A的所表示的空间的一组基 ( 4 , 1 ) , ( − 2 , 1 ) (4,1) , (-2,1) (4,1),(−2,1)与标准基之间的基变换或是坐标系转换。
而在这个变换过程中,存在一些特殊的向量,如对于变换矩阵 A = [ 4 − 2 1 1 ] A= \begin{bmatrix} 4&-2 \\ 1&1 \end{bmatrix} A=[41−21]所代表的变换,存在向量 u ⃗ = ( 2 , 2 ) \vec u = (2,2) u=(2,2) ,该向量在矩阵 A A A的变换下 A ⋅ u ⃗ = u ⃗ ′ = ( 4 , 4 ) A \cdot \vec u = \vec u' = (4,4) A⋅u=u′=(4,4), u ⃗ ′ \vec u' u′与变换前的 u ⃗ \vec u u 相比,方向上未发生改变,仅仅只是对原向量 u ⃗ \vec u u进行了缩放 u ⃗ ′ = 2 u ⃗ \vec u' = 2 \vec u u′=2u :
特征值和特征向量的定义
对于在矩阵
A
A
A的变换下, 向量变换后得到的结果向量 方向并没有发生改变,只是原来向量的某一个常数
k
k
k倍,即
A
⋅
u
⃗
=
λ
⋅
u
⃗
A \cdot \vec u = \lambda \cdot \vec u
A⋅u=λ⋅u式中,
A
A
A是转换矩阵,
u
⃗
\vec u
u是被转换向量,
λ
\lambda
λ是常数(可以取负数)。当常数
λ
\lambda
λ取负数的时候,意味着变换前后的两个向量方向相反,但是它们还是共线向量,也可以称为同向向量。
对于满足关系式 A ⋅ u ⃗ = λ ⋅ u ⃗ A \cdot \vec u = \lambda \cdot \vec u \, \, \, A⋅u=λ⋅u 的 λ \lambda λ 和 u ⃗ \vec u u 则称:
- λ \color {red} \lambda λ 称为矩阵A的特征值 ( e i g e n v a l u e ) \color {red} {(eigenvalue)} (eigenvalue)
- u ⃗ \color {red} {\vec u} u 称为矩阵A对应于 λ \color {red} \lambda λ的特征向量 ( e i g e n v e c t o r ) \color {red} {(eigenvector)} (eigenvector)
求解特征值和特征向量
假设变换矩阵为
A
=
[
4
−
2
1
1
]
A= \begin{bmatrix} 4&-2 \\ 1&1 \end{bmatrix}
A=[41−21]
求解变换矩阵
A
A
A的特征值和特征向量 即求解方程
A
u
⃗
=
λ
u
⃗
A \vec u = \lambda \vec u
Au=λu,这个方程涉及两个未知量
u
⃗
\vec u
u 和
λ
\lambda
λ:
-
首先,如果 u ⃗ = O \vec u = O u=O ,即 u ⃗ \vec u u是一个零向量,则一定满足方程,这个零解是一个平凡解,意味着不管矩阵 A A A如何变化, u ⃗ = O \vec u = O u=O永远是方程 A u ⃗ = λ u ⃗ A \vec u = \lambda \vec u Au=λu,所以特征向量的零解没有意义,求解特征向量不考虑 零向量 \color {red} {\small 零向量} 零向量。
-
而对于求解的特征值,如果求解出一个 λ = 0 \lambda = 0 λ=0 ,这个解不是一个平凡解, λ = 0 \lambda = 0 λ=0意味着方程 A u ⃗ = 0 A \vec u = 0 Au=0是一个齐次线性系统,对于一个齐次线性系统只可能有唯一零解或无穷解,因为 u ⃗ \vec u u不能取零向量,所以 A u ⃗ = 0 A \vec u = 0 Au=0一定有无穷解,那么意味着特征值 λ = 0 \lambda = 0 λ=0 反映出变换矩阵 A A A一定不可逆的特征 (矩阵 A A A可逆则 A u ⃗ = 0 A \vec u = 0 Au=0只有唯一零解) ,并不是任何一个矩阵都存在特征值 λ = 0 \lambda = 0 λ=0。
进一步的解方程 A u ⃗ = λ u ⃗ A \vec u = \lambda \vec u Au=λu
A
u
⃗
=
λ
u
⃗
→
A
u
⃗
−
λ
u
⃗
=
0
A \vec u = \lambda \vec u \to A \vec u - \lambda \vec u =0
Au=λu→Au−λu=0,这里涉及矩阵与常数的减法,引入单位矩阵
I
I
I 处理
A
u
⃗
⋅
I
=
λ
u
⃗
⋅
I
A \vec u \cdot I = \lambda \vec u \cdot I
Au⋅I=λu⋅I
A
u
⃗
−
λ
I
u
⃗
=
0
A \vec u - \lambda I \vec u = 0
Au−λIu=0 变形得到
(
A
−
λ
I
)
⋅
u
⃗
=
0
(A - \lambda I) \cdot \vec u = 0
(A−λI)⋅u=0
step.1 变换矩阵 A A A 的特征方程,解特征值
对于线性系统 ( A − λ I ) ⋅ u ⃗ = 0 (A - \lambda I) \cdot \vec u = 0 (A−λI)⋅u=0,我们希望最后求解的特征向量 u ⃗ \vec u u有非零解,因为零解是一个平凡解,无意义。因此对于系数矩阵 ( A − λ I ) (A - \lambda I) (A−λI)要求是一个不可逆矩阵,矩阵可逆,意味着该系统只有唯一零解。根据行列式的内容可知如果矩阵不可逆意味着它的行列式的值为0,所以,转而求解 det ( A − λ I ) = 0 \det (A - \lambda I)=0 det(A−λI)=0 ,这个方程只含有一个未知量 λ \lambda λ,称为变换矩阵 A A A的特征方程:
示例:
det ( A − λ I ) = ∣ 4 − λ − 2 1 1 − λ ∣ = ( 4 − λ ) ( 1 − λ ) − ( 1 × − 2 ) = λ 2 − 5 λ + 6 \det (A - \lambda I)= \begin{vmatrix} 4-\lambda & -2 \\1 & 1-\lambda \end{vmatrix} = (4-\lambda)(1-\lambda) -(1\times-2) =\lambda^{2} -5\lambda +6 det(A−λI)= 4−λ1−21−λ =(4−λ)(1−λ)−(1×−2)=λ2−5λ+6
det ( A − λ I ) = λ 2 − 5 λ + 6 = 0 \det (A - \lambda I) = \lambda^{2} -5\lambda +6 = 0 det(A−λI)=λ2−5λ+6=0
解的 λ 1 = 2 , λ 2 = 3 \lambda_1 = 2, \lambda_2 = 3 λ1=2,λ2=3
step.2 解特征向量
求出了矩阵的特征值,就可以代入 λ \lambda λ到线性系统 ( A − λ I ) ⋅ u ⃗ = 0 (A - \lambda I) \cdot \vec u = 0 (A−λI)⋅u=0进一步求解出特征向量 u ⃗ \vec u u:
① 当 λ 1 = 2 \lambda_1 = 2 λ1=2
\, \, \, 代入线性系统可得 ( A − 2 I ) ⋅ u ⃗ = 0 (A - 2I) \cdot \vec u = 0 (A−2I)⋅u=0,求解这个线性系统的非零解
\, \, \, 系数矩阵为 ( A − 2 I ) = [ 4 − 2 − 2 1 1 − 2 ] (A - 2I) = \begin{bmatrix} 4-2 & -2 \\1 & 1-2 \end{bmatrix} (A−2I)=[4−21−21−2],执行高斯消元化为一般行最简形式
\, \, \, 方程变为 [ 1 − 1 0 0 ] ⋅ u ⃗ = 0 \begin{bmatrix} 1 & -1 \\ 0&0 \end{bmatrix} \cdot \vec u = 0 [10−10]⋅u=0根据 零空间 的知识,这个方程的解 u ⃗ \vec u u 其实就是矩阵 ( A − 2 I ) (A - 2I) (A−2I) 的零空间的内的向量,
由系数矩阵 ( A − 2 I ) (A - 2I) (A−2I)的行最简形式 [ 1 − 1 0 0 ] \begin{bmatrix} 1 & -1 \\ 0&0 \end{bmatrix} [10−10]可知自由列有一列,那么它的零空间的基就只有一个可以写成 p ⃗ = [ 1 1 ] \vec p =\begin{bmatrix} 1 \\ 1 \end{bmatrix} p=[11]
所以方程的解,也即变换矩阵 A A A的特征向量 u ⃗ \vec u u 就可以表示为 u ⃗ = [ 1 1 ] ⋅ k \vec u = \begin{bmatrix} 1 \\ 1 \end{bmatrix} \cdot k u=[11]⋅k, k k k可以取任意非零常数② 当 λ 2 = 3 \lambda_2 = 3 λ2=3
\, \, \, 计算步骤同①
\, \, \, 系数矩阵高斯消元化为行最简形式,方程变为 [ 1 − 2 0 0 ] ⋅ u ⃗ = 0 \begin{bmatrix} 1 & -2 \\ 0&0 \end{bmatrix} \cdot \vec u = 0 [10−20]⋅u=0
可解的系数矩阵 ( A − 3 I ) (A - 3I) (A−3I) 的零空间的基为 p ⃗ = [ 2 1 ] \vec p =\begin{bmatrix} 2 \\ 1 \end{bmatrix} p=[21],变化矩阵A对应与 λ 2 \lambda_2 λ2的特征向量表示 u ⃗ = [ 2 1 ] ⋅ k \vec u = \begin{bmatrix} 2 \\ 1 \end{bmatrix} \cdot k u=[21]⋅k, k k k可以取任意非零常数。