文章内容
特征值 / 特征向量
相似矩阵
对称矩阵的相似对角化
特征值 / 特征向量
什么是特征值、特征向量
定义 :设 A A A 为 n n n 阶矩阵(方阵),若存在常数 λ \lambda λ 和非零 n n n 维列向量 x x x ,使 A x = λ x Ax=\lambda x A x = λ x ,则称 λ \lambda λ 为 A A A 的特征值,x x x 是 A A A 的属于特征值 λ \lambda λ 的特征向量.
易得:A x = λ x → ( A − λ ) x = 0 → ( A − λ E ) x = 0 Ax=\lambda x \rightarrow (A-\lambda)x=0 \rightarrow (A-\lambda E)x=0 A x = λ x → ( A − λ ) x = 0 → ( A − λ E ) x = 0
矩阵的加减法只能应用于同型矩阵,矩阵是无法和常数相加减的,但是对于方阵来说,加减一个常数相当于加减这个常数乘以单位矩阵 E E E .
已知向量 x x x 为非零向量,则齐次方程组 ( A − λ E ) x = 0 (A-\lambda E)x = 0 ( A − λ E ) x = 0 有非零解,则 R ( A − λ E ) < 0 R(A-\lambda E) < 0 R ( A − λ E ) < 0 ,又因为矩阵 A − λ E A-\lambda E A − λ E 是方阵,则有其对应的行列式 ∣ A − λ E ∣ ≠ 0 |A-\lambda E| \neq 0 ∣ A − λ E ∣ = 0
行列式 ∣ A − λ E ∣ = ∣ a 11 − λ a 12 ⋯ a 1 n a 21 a 22 − λ ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n − λ ∣ |A-\lambda E|= \begin{vmatrix} a_{11}-\lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}-\lambda \end{vmatrix} ∣ A − λ E ∣ = ∣ ∣ a 11 − λ a 21 ⋮ a n 1 a 12 a 22 − λ ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn − λ ∣ ∣
可以很容易看出,该行列式展开之后得到的是一个关于未知数 λ \lambda λ 的表达式,我们设这个表达式为 f ( λ ) f(\lambda) f ( λ ) ,则有 f ( λ ) = 0 f(\lambda)=0 f ( λ ) = 0 ,这个方程被称为特征方程 ,将该特征方程进行因式分解得到特征多项式 ,该 方程(多项式) 的解就是特征值 λ \lambda λ 的值 (可能有多个特征值)
特征方程因式分解:将 f ( λ ) f(\lambda) f ( λ ) 化成 ( λ − a ) ( λ − b ) ⋯ = 0 (\lambda-a)(\lambda-b)\cdots=0 ( λ − a ) ( λ − b ) ⋯ = 0 的形式.
将求得的特征值 λ \lambda λ 代入到原来的式子 ( A − λ E ) x = 0 (A-\lambda E)x=0 ( A − λ E ) x = 0 ,已知 λ , A \lambda,A λ , A ,可求得非零解 x x x ,求出的 x x x 就是 A A A 的对应特征值 λ \lambda λ 的特征向量
每个特征值都带入原式求出其对应的特征向量.
设 n n n 阶矩阵 A A A 的 n n n 个特征值为 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ 1 , λ 2 , ⋯ , λ n ,则有:{ ∑ i = 1 n λ i = ∑ i = 1 n a i i ∏ i = 1 n λ i = ∣ A ∣ \begin{cases} \sum_{i=1}^n\lambda_i=\sum_{i=1}^n a_{ii} \\ \prod_{i=1}^n \lambda_i=|A| \end{cases} { ∑ i = 1 n λ i = ∑ i = 1 n a ii ∏ i = 1 n λ i = ∣ A ∣ ,证明过程就不详细展开来证了。
一元 n n n 次方程中中所有根之和和所有根之积有明确定义,例如适用于一元二次方程的韦达定理 ( { x 1 + x 2 = − b a x 1 x 2 = c a ) (\begin{cases} x_1+x_2=-\frac {b}{a} \\ x_1x_2=\frac {c}{a} \end{cases}) ( { x 1 + x 2 = − a b x 1 x 2 = a c ) ,上方的情况是一元 n n n 次方程.
方阵中正对角线元素的和:例如对方阵 A A A 中正对角线元素取和,被称为矩阵 A A A 的迹,记作 t r ( A ) tr(A) t r ( A ) .
不同特征值对应的特征向量是线性无关的
注 :矩阵 A n ∗ n A_{n*n} A n ∗ n 最后最多会有 n n n 个特征值(可能会有相同的特征值),因为矩阵 A − λ E A-\lambda E A − λ E 对应的行列式展开后 f ( x ) = 0 f(x)=0 f ( x ) = 0 是关于 λ \lambda λ 的 n n n 阶方程。
从几何上解释特征值、特征向量
变形的命名上并不标准,重点看如何进行变换
① 伸缩变换
回头看定义中的式子:A x = λ x Ax=\lambda x A x = λ x ,直面上的意思就是说向量 x x x 左乘矩阵 A A A ,相当于向量 x x x 的 λ \lambda λ 倍
例如设 A = [ 1 0 0 k ] , x = [ 0 1 ] A=\begin{bmatrix} 1 & 0 \\ 0 & k \end{bmatrix},x=\begin{bmatrix} 0 \\ 1\end{bmatrix} A = [ 1 0 0 k ] , x = [ 0 1 ] ,则有 [ 1 0 0 k ] [ 0 1 ] = k [ 0 1 ] \begin{bmatrix} 1 & 0 \\ 0 & k \end{bmatrix}\begin{bmatrix} 0 \\ 1\end{bmatrix} = k\begin{bmatrix} 0 \\ 1\end{bmatrix} [ 1 0 0 k ] [ 0 1 ] = k [ 0 1 ]
即向量 x x x 在 x 1 x_1 x 1 方向上不变,x 2 x_2 x 2 方向上变为原来的 k k k 倍,其中 [ 0 1 ] \begin{bmatrix} 0 \\ 1 \end{bmatrix} [ 0 1 ] 就是特征向量,k k k 就是特征值.
② 平移变换
有 [ 1 k 0 1 ] [ 1 0 ] = [ 1 0 ] \begin{bmatrix} 1 & k \\ 0 & 1 \end{bmatrix}\begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 1 \\ 0\end{bmatrix} [ 1 0 k 1 ] [ 1 0 ] = [ 1 0 ] ,可以发现大小是不变的,但是位置发生了改变,对于向量 x x x :
变化前:( 0 , 0 ) → ( 0 , 1 ) (0,0) \rightarrow (0,1) ( 0 , 0 ) → ( 0 , 1 )
变化后:( k , 1 ) → ( k + 1 , 1 ) (k,1) \rightarrow (k+1,1) ( k , 1 ) → ( k + 1 , 1 )
特征值为1,特征向量为 [ 1 0 ] \begin{bmatrix} 1 \\ 0\end{bmatrix} [ 1 0 ]
③ 镜像变换
左乘矩阵 [ 0 1 1 0 ] \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} [ 0 1 1 0 ] 相当于沿着对角线 x 2 = x 1 x_2=x_1 x 2 = x 1 进行翻转
要保证向量 x x x 不发生改变,可见向量必须在这条线上
有: [ 0 1 1 0 ] [ 1 1 ] = [ 1 1 ] \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 1 \\ 1\end{bmatrix} = \begin{bmatrix} 1 \\ 1\end{bmatrix} [ 0 1 1 0 ] [ 1 1 ] = [ 1 1 ] ,其中特征值为 1 1 1 ,特征向量为 [ 1 1 ] \begin{bmatrix} 1 \\ 1 \end{bmatrix} [ 1 1 ]
④ 旋转变换
可见旋转变换整个一周中没有操作前后保持不变的向量这种情况,这种变换没有特征值、特征向量
由此可见 A x = λ x Ax=\lambda x A x = λ x ,变化前后向量共线,只是大小发生了改变,变为原来的 λ \lambda λ 倍,特征值就是放大的倍数,特征向量就是经过矩阵 A A A 改变前后仍然共线的向量.此外,从几何解释中也可以看出,特征向量就是前后共线的向量,那么就有若 x x x 为特征向量,则 k x kx k x 也为特征向量.
特征值、特征向量的求解过程
一般求解思路 :求解的过程相当于齐次方程组 ( A − λ E ) x = 0 (A-\lambda E)x=0 ( A − λ E ) x = 0 求解,其中 A − λ E A-\lambda E A − λ E 为系数矩阵,以 ∣ A − λ E ∣ = 0 |A-\lambda E|=0 ∣ A − λ E ∣ = 0 先求得特征值 λ \lambda λ ,然后将多个 λ \lambda λ 分别带入到 ( A − λ E ) x = 0 (A-\lambda E)x=0 ( A − λ E ) x = 0 中求得每个特征值 λ \lambda λ 对应的特征向量 x x x .
∣ A − λ E ∣ = 0 |A-\lambda E|=0 ∣ A − λ E ∣ = 0 因为特征向量是非零向量,因此不能有零解,因此有 R ( A − λ E ) < n R(A-\lambda E) < n R ( A − λ E ) < n ,非满秩,根据矩阵的秩的定义得,∣ A − λ E ∣ = 0 |A-\lambda E|=0 ∣ A − λ E ∣ = 0 .
例 :求矩阵 A = [ 3 − 1 − 1 3 ] A=\begin{bmatrix} 3 & -1 \\ -1 & 3 \end{bmatrix} A = [ 3 − 1 − 1 3 ] 的特征值和特征向量
由 A x = λ E Ax=\lambda E A x = λ E 得 ( A − λ E ) x = 0 (A-\lambda E)x = 0 ( A − λ E ) x = 0
易得 A − λ E = [ 3 − λ − 1 − 1 3 − λ ] A-\lambda E = \begin{bmatrix} 3-\lambda & -1 \\ -1 & 3-\lambda \end{bmatrix} A − λ E = [ 3 − λ − 1 − 1 3 − λ ]
则有 ∣ A − λ E ∣ = ∣ 3 − λ − 1 − 1 3 − λ ∣ = ( 3 − λ ) 2 − 1 = 0 |A-\lambda E| = \begin{vmatrix} 3-\lambda & -1 \\ -1 & 3-\lambda \end{vmatrix} = (3-\lambda)^2 – 1 = 0 ∣ A − λ E ∣ = ∣ ∣ 3 − λ − 1 − 1 3 − λ ∣ ∣ = ( 3 − λ ) 2 − 1 = 0 ,解得:{ λ 1 = 2 λ 2 = 4 \begin{cases} \lambda_1 = 2 \\ \lambda_2 = 4 \end{cases} { λ 1 = 2 λ 2 = 4
将 λ 1 \lambda_1 λ 1 代入 ( A − λ E ) x = 0 (A-\lambda E)x = 0 ( A − λ E ) x = 0 :
系数矩阵 A − λ E A-\lambda E A − λ E 先初等变换为行阶梯矩阵的形式:[ 1 − 1 − 1 1 ] ∼ [ 1 − 1 0 0 ] \begin{bmatrix}1 & -1 \\ -1 & 1\end{bmatrix} \sim \begin{bmatrix} 1 & -1 \\ 0 & 0 \end{bmatrix} [ 1 − 1 − 1 1 ] ∼ [ 1 0 − 1 0 ]
自由变量有 n − R ( A − λ E ) = 1 n-R(A-\lambda E)=1 n − R ( A − λ E ) = 1 个,主元为 x 1 x_1 x 1 ,自由变量为 x 2 x_2 x 2
有 [ 1 − 1 0 0 ] x = 0 \begin{bmatrix} 1 & -1 \\ 0 & 0 \end{bmatrix}x = 0 [ 1 0 − 1 0 ] x = 0 ,即 x 1 − x 2 = 0 x_1-x_2=0 x 1 − x 2 = 0 .
一个基础解系 (x 2 x_2 x 2 为1),直接代入得到结果 [ 1 1 ] \begin{bmatrix} 1 \\ 1 \end{bmatrix} [ 1 1 ]
λ 2 \lambda_2 λ 2 同理,得到结果 [ − 1 1 ] \begin{bmatrix} -1 \\ 1 \end{bmatrix} [ − 1 1 ]
则矩阵 A A A 的特征值和特征向量分别为:{ λ 1 = 2 p 1 = [ 1 1 ] \begin{cases} \lambda_1=2 \\ p_1=\begin{bmatrix} 1 \\ 1 \end{bmatrix} \end{cases} ⎩ ⎨ ⎧ λ 1 = 2 p 1 = [ 1 1 ] ,{ λ 2 = 4 p 2 = [ − 1 1 ] \begin{cases} \lambda_2=4 \\ p_2=\begin{bmatrix} -1 \\ 1 \end{bmatrix} \end{cases} ⎩ ⎨ ⎧ λ 2 = 4 p 2 = [ − 1 1 ]
正如文章前面提到的,若 x x x 为特征向量,则 k x kx k x 仍然为特征向量,若题目中问的是求解矩阵 A A A 的所有 特征向量,则需要用该齐次方程组的通解来表示 (注意 k ≠ 0 k\neq 0 k = 0 ):
{ λ 1 = 2 p 1 = k [ 1 1 ] \begin{cases} \lambda_1=2 \\ p_1=k\begin{bmatrix} 1 \\ 1 \end{bmatrix} \end{cases} ⎩ ⎨ ⎧ λ 1 = 2 p 1 = k [ 1 1 ] ,{ λ 2 = 4 p 2 = k [ − 1 1 ] ( k ≠ 0 , k ∈ R ) \begin{cases} \lambda_2=4 \\ p_2=k\begin{bmatrix} -1 \\ 1 \end{bmatrix} \end{cases} \quad (k\neq 0, k \in R) ⎩ ⎨ ⎧ λ 2 = 4 p 2 = k [ − 1 1 ] ( k = 0 , k ∈ R )
,线性代数中规定:特征值可为0 ,表示每一个特征值都对应着无穷个特征向量,但特征向量不可为零向量
例 :求矩阵 A = [ − 1 1 0 − 4 3 0 1 0 2 ] A=\begin{bmatrix} -1 & 1 & 0 \\ -4 & 3 & 0 \\ 1 & 0 & 2 \end{bmatrix} A = ⎣ ⎡ − 1 − 4 1 1 3 0 0 0 2 ⎦ ⎤ 的特征值和特征向量.
由 A x = λ x Ax=\lambda x A x = λ x 得,( A − λ E ) x = 0 (A-\lambda E)x=0 ( A − λ E ) x = 0
∣ A − λ E ∣ = ∣ − 1 − λ 1 0 − 4 3 − λ 0 1 0 2 − λ ∣ = 0 |A-\lambda E| = \begin{vmatrix} -1-\lambda & 1 & 0 \\ -4 & 3-\lambda & 0 \\ 1 & 0 & 2-\lambda \end{vmatrix}=0 ∣ A − λ E ∣ = ∣ ∣ − 1 − λ − 4 1 1 3 − λ 0 0 0 2 − λ ∣ ∣ = 0
则有:∣ A − λ E ∣ = ( 2 − λ ) ( − 1 ) 3 + 3 ∣ − 1 − λ 1 − 4 3 − λ ∣ = 0 |A-\lambda E|=(2-\lambda)(-1)^{3+3}\begin{vmatrix} -1-\lambda & 1 \\ -4 & 3-\lambda \end{vmatrix}=0 ∣ A − λ E ∣ = ( 2 − λ ) ( − 1 ) 3 + 3 ∣ ∣ − 1 − λ − 4 1 3 − λ ∣ ∣ = 0
行列式的值 = 某一行/某一列中元素与其对应的代数余子式的积之和,这里选择的是第三列.
整理得:( 2 − λ ) [ ( λ + 1 ) ( λ − 3 ) + 4 ] = ( 2 − λ ) ( λ − 1 ) 2 = 0 (2-\lambda)[(\lambda + 1)(\lambda – 3)+4]=(2-\lambda)(\lambda-1)^2=0 ( 2 − λ ) [( λ + 1 ) ( λ − 3 ) + 4 ] = ( 2 − λ ) ( λ − 1 ) 2 = 0
解得:{ λ 1 = 2 λ 2 = λ 3 = 1 \begin{cases} \lambda_1=2 \\ \lambda_2=\lambda_3=1 \end{cases} { λ 1 = 2 λ 2 = λ 3 = 1
当 λ 1 = 2 \lambda_1 = 2 λ 1 = 2 时:
∣ A − λ E ∣ = [ − 3 1 0 − 4 1 0 1 0 0 ] ∼ [ 1 0 0 0 1 0 0 0 0 ] |A-\lambda E| = \begin{bmatrix} -3 & 1 & 0 \\ -4 & 1 & 0 \\ 1 & 0 & 0 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix} ∣ A − λ E ∣ = ⎣ ⎡ − 3 − 4 1 1 1 0 0 0 0 ⎦ ⎤ ∼ ⎣ ⎡ 1 0 0 0 1 0 0 0 0 ⎦ ⎤
易得自由变量个数为 n − R ( A − λ E ) = 1 n-R(A-\lambda E)=1 n − R ( A − λ E ) = 1 ,主元为 x 1 , x 2 x_1,x_2 x 1 , x 2 ,自由变量为 x 3 x_3 x 3
基础解系:[ x 1 x 2 1 ] \begin{bmatrix} x_1 \\ x_2 \\ 1 \end{bmatrix} ⎣ ⎡ x 1 x 2 1 ⎦ ⎤
新的齐次方程组:{ − 3 x 1 + x 2 = 0 − x 2 = 0 \begin{cases} -3x_1 + x_2 = 0 \\ -x_2 = 0 \end{cases} { − 3 x 1 + x 2 = 0 − x 2 = 0 ,解得:p 1 = [ 0 0 1 ] p_1=\begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix} p 1 = ⎣ ⎡ 0 0 1 ⎦ ⎤
当 λ 2 = λ 3 = 1 \lambda_2=\lambda_3=1 λ 2 = λ 3 = 1 时,同理得到 p 2 = [ − 1 − 2 1 ] p_2=\begin{bmatrix} -1 \\ -2 \\ 1 \end{bmatrix} p 2 = ⎣ ⎡ − 1 − 2 1 ⎦ ⎤
则矩阵 A A A 的特征值和特征向量分别为:{ λ 1 = 2 p 1 = [ 0 0 1 ] \begin{cases} \lambda_1=2 \\ p_1=\begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix} \end{cases} ⎩ ⎨ ⎧ λ 1 = 2 p 1 = ⎣ ⎡ 0 0 1 ⎦ ⎤ ,{ λ 2 = λ 3 = 1 p 2 = [ − 1 − 2 1 ] \begin{cases} \lambda_2=\lambda_3 = 1 \\ p_2=\begin{bmatrix} -1 \\ -2 \\ 1 \end{bmatrix} \end{cases} ⎩ ⎨ ⎧ λ 2 = λ 3 = 1 p 2 = ⎣ ⎡ − 1 − 2 1 ⎦ ⎤
例 :设 α = [ a 1 , a 2 , ⋯ , a n ] T , β = [ b 1 , b 2 , ⋯ , n n ] T , A = α β T \alpha=[a_1,a_2,\cdots,a_n]^T,\beta=[b_1,b_2,\cdots,n_n]^T,A=\alpha\beta^T α = [ a 1 , a 2 , ⋯ , a n ] T , β = [ b 1 , b 2 , ⋯ , n n ] T , A = α β T 且 ( α , β ) = 3 (\alpha, \beta)=3 ( α , β ) = 3 ,求 A A A 的特征值及重数,以及 A A A 的非零特征值对应的线性无关的特征向量.
这里的重数指代数重数,例如 ( x − 2 ) 3 = 0 (x-2)^3=0 ( x − 2 ) 3 = 0 ,则特征值为 2 2 2 ,该特征值的重数为 3 3 3
这种题知道解题思路后可以一眼秒出结果,解题思路如下:
A = α β T = [ a 1 a 2 ⋮ a n ] [ b 1 b 2 ⋯ b n ] = [ a 1 b 1 a 1 b 2 ⋯ a n b n a 2 b 1 a 2 b 2 ⋯ a 2 b n ⋮ ⋮ ⋮ a n b 1 a n b 2 ⋯ a n b n ] A = \alpha\beta^T = \begin{bmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{bmatrix}\begin{bmatrix} b_1 & b_2 & \cdots & b_n \end{bmatrix} = \begin{bmatrix} a_1b_1 & a_1b_2 & \cdots & a_nb_n \\ a_2b_1 & a_2b_2 & \cdots & a_2b_n \\ \vdots & \vdots & & \vdots \\ a_nb_1 & a_nb_2 & \cdots & a_nb_n\end{bmatrix} A = α β T = ⎣ ⎡ a 1 a 2 ⋮ a n ⎦ ⎤ [ b 1 b 2 ⋯ b n ] = ⎣ ⎡ a 1 b 1 a 2 b 1 ⋮ a n b 1 a 1 b 2 a 2 b 2 ⋮ a n b 2 ⋯ ⋯ ⋯ a n b n a 2 b n ⋮ a n b n ⎦ ⎤
( α , β ) = α T β = t r ( A ) = 3 (\alpha,\beta)=\alpha^T\beta=tr(A)=3 ( α , β ) = α T β = t r ( A ) = 3
要求特征值和特征向量,设 A x = λ x Ax=\lambda x A x = λ x
由 A x = λ x Ax=\lambda x A x = λ x 得:A 2 x = A ( A x ) = λ ( A x ) = λ ( λ x ) = λ 2 x A^2x = A(Ax) = \lambda (Ax) = \lambda (\lambda x)=\lambda^2 x A 2 x = A ( A x ) = λ ( A x ) = λ ( λ x ) = λ 2 x
即 A 2 x = λ 2 x A^2x=\lambda^2 x A 2 x = λ 2 x .
又因为 A 2 = A A = ( α β T ) ( α β T ) = α ( β T α ) β T = α ( α , β ) β T = 3 α β T = 3 A A^2 = AA=(\alpha\beta^T)(\alpha\beta^T)=\alpha(\beta^T\alpha)\beta^T=\alpha(\alpha,\beta)\beta^T=3\alpha\beta^T=3A A 2 = AA = ( α β T ) ( α β T ) = α ( β T α ) β T = α ( α , β ) β T = 3 α β T = 3 A
即 A 2 = 3 A A^2=3A A 2 = 3 A .
则有 A 2 − 3 A = 0 A^2-3A=0 A 2 − 3 A = 0
整理得 ( A 2 − 3 A ) x = A 2 x − 3 A x = λ 2 x − 3 λ x = λ ( λ − 3 ) x = 0 (A^2-3A)x = A^2x-3Ax = \lambda^2x-3\lambda x=\lambda(\lambda-3)x=0 ( A 2 − 3 A ) x = A 2 x − 3 A x = λ 2 x − 3 λ x = λ ( λ − 3 ) x = 0
A 2 − 3 A = 0 → ( A 2 − 3 A ) x = 0 A^2-3A=0\rightarrow (A^2-3A)x=0 A 2 − 3 A = 0 → ( A 2 − 3 A ) x = 0
即 λ ( λ − 3 ) x = 0 \lambda(\lambda – 3)x=0 λ ( λ − 3 ) x = 0 ,即 { λ 1 = 0 λ 2 = 3 \begin{cases} \lambda_1 = 0 \\ \lambda_2 = 3 \end{cases} { λ 1 = 0 λ 2 = 3 ,λ \lambda λ 为 0 或 3
又因为所有特征值的和 ∑ i = 1 n λ i = t r ( A ) = ( α , β ) = 3 \sum _{i=1}^n \lambda_i = tr(A)=(\alpha,\beta)=3 ∑ i = 1 n λ i = t r ( A ) = ( α , β ) = 3
不难看出 { λ 1 = λ 2 = ⋯ = λ n − 1 = 0 λ n = 3 \begin{cases} \lambda_1 = \lambda_2 = \cdots = \lambda_{n-1}=0 \\ \lambda_n = 3 \end{cases} { λ 1 = λ 2 = ⋯ = λ n − 1 = 0 λ n = 3 ,即 特征值 { 0 , r 1 = n − 1 3 , r 2 = 1 \begin{cases} 0,\quad r_1=n-1 \\ 3,\quad r_2=1 \end{cases} { 0 , r 1 = n − 1 3 , r 2 = 1
r i r_i r i 为 第 i i i 个特征值对应的重数
题目要求不考虑特征值为 0 时对应的特征向量,只需考虑特征值为 3 的情况
由于 A α = α β T α = α ( α , β ) = 3 α A\alpha = \alpha \beta^T \alpha = \alpha(\alpha,\beta)=3\alpha A α = α β T α = α ( α , β ) = 3 α
即 A α = 3 α A\alpha=3\alpha A α = 3 α ,因此特征值 3 3 3 对应的特征向量就为 α \alpha α
综上所述:特征值为 0 , 3 0,3 0 , 3 ,分别对应的重数为 n − 1 , 1 n-1,1 n − 1 , 1 ,特征值 3 3 3 对应的特征向量为 α \alpha α .
结论 :对于每行每列成比例的矩阵 A A A ,矩阵 A A A 一定能拆成一个列向量 α \alpha α 乘以一个行向量 β \beta β ,也就是上方例题中的情况,这种矩阵它的特征值有两个,分别是 0 和 ( α , β ) (\alpha,\beta) ( α , β ) ,后者特征值对应的特征向量为列向量 α \alpha α
例 :A = [ 1 2 3 2 4 6 3 6 9 ] = [ 1 2 3 ] [ 1 2 3 ] A=\begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{bmatrix} = \begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix} \begin{bmatrix} 1 & 2 & 3 \end{bmatrix} A = ⎣ ⎡ 1 2 3 2 4 6 3 6 9 ⎦ ⎤ = ⎣ ⎡ 1 2 3 ⎦ ⎤ [ 1 2 3 ]
补充 :求特征值为 0 0 0 时对应的特征向量
A x = λ x → ( A − λ E ) x = 0 Ax=\lambda x \rightarrow (A-\lambda E)x = 0 A x = λ x → ( A − λ E ) x = 0 ,有 A x = 0 Ax=0 A x = 0 ,求解齐次方程组 A x = 0 Ax=0 A x = 0 即可,该齐次方程组的通解表示的无穷多个向量就是该特征值对应的特征向量。
矩阵和特征值的关系
矩阵和特征值的关系 :对于 A x = λ x Ax=\lambda x A x = λ x ,有函数关系 f ( A ) x = f ( λ ) x f(A)x = f(\lambda)x f ( A ) x = f ( λ ) x
例如对于矩阵 A A A 有特征值 λ \lambda λ ,则对于矩阵 2 A − 1 − 2 E 2A^{-1}-2E 2 A − 1 − 2 E 有特征值 2 λ − 1 − 2 2\lambda^{-1}-2 2 λ − 1 − 2 .
例 :λ \lambda λ 是方阵 A A A 的特征值,证明:
λ n \lambda^n λ n 是 A n A^n A n 的特征值
当 A A A 可逆时,1 λ \frac {1}{\lambda} λ 1 是 A − 1 A^{-1} A − 1 的特征值
① λ n \lambda^n λ n 是 A n A^n A n 的特征值
证:已知 A x = λ x Ax=\lambda x A x = λ x
则有 A n x = A n − 1 A x = A n − 1 λ x = λ A n − 2 A x = λ 2 A n − 2 x = ⋯ = λ n x A^nx = A^{n-1}Ax=A^{n-1}\lambda x = \lambda A^{n-2}Ax = \lambda^2A^{n-2}x = \cdots = \lambda^nx A n x = A n − 1 A x = A n − 1 λ x = λ A n − 2 A x = λ 2 A n − 2 x = ⋯ = λ n x
② 当 A A A 可逆时,1 λ \frac {1}{\lambda} λ 1 是 A − 1 A^{-1} A − 1 的特征值
证:已知 A x = λ x Ax=\lambda x A x = λ x
则有 A A − 1 x = A − 1 λ x → 1 λ x = A − 1 x AA^{-1}x=A^{-1}\lambda x \rightarrow \frac {1}{\lambda}x=A^{-1}x A A − 1 x = A − 1 λ x → λ 1 x = A − 1 x
即 A − 1 x = 1 λ x A^{-1}x=\frac {1}{\lambda}x A − 1 x = λ 1 x .
例 :设3阶矩阵 A A A 的特征值为 1, -1, 2, 求 A ∗ + 3 A − 2 E A^*+3A-2E A ∗ + 3 A − 2 E 的特征值
已知矩阵 A A A 的所有特征值,则 ∣ A ∣ = 1 ∗ ( − 1 ) ∗ 2 = − 2 |A|=1*(-1)*2=-2 ∣ A ∣ = 1 ∗ ( − 1 ) ∗ 2 = − 2
由 A A ∗ = ∣ A ∣ E AA^*=|A|E A A ∗ = ∣ A ∣ E 得:A − 1 = A ∗ ∣ A ∣ A^{-1}=\frac {A^*}{|A|} A − 1 = ∣ A ∣ A ∗ ,即 A ∗ = − 2 A − 1 A^*=-2A^{-1} A ∗ = − 2 A − 1
则原式 = − 2 A − 1 + 3 A − 2 E -2A^{-1}+3A-2E − 2 A − 1 + 3 A − 2 E
已知 A x = λ x Ax=\lambda x A x = λ x
则有:( − 2 A − 1 + 3 A − 2 E ) x = − 2 A − 1 x + 3 A x − 2 E x = − 2 λ − 1 x + 3 λ x − 2 x = ( − 2 λ − 1 + 3 λ − 2 ) x (-2A^{-1}+3A-2E)x=-2A^{-1}x+3Ax-2Ex=-2\lambda^{-1}x+3\lambda x-2x=(-2\lambda^{-1} + 3\lambda -2)x ( − 2 A − 1 + 3 A − 2 E ) x = − 2 A − 1 x + 3 A x − 2 E x = − 2 λ − 1 x + 3 λ x − 2 x = ( − 2 λ − 1 + 3 λ − 2 ) x
则特征值为 − 1 , − 3 , 3 -1, -3, 3 − 1 , − 3 , 3
相似矩阵
什么是相似矩阵
定义 :设 A , B A,B A , B 是 n n n 阶矩阵,若存在可逆矩阵 P P P ,使 B = P − 1 A P B=P^{-1}AP B = P − 1 A P ,则称矩阵 A A A 与 B B B 相似,记为 A ∼ B A \sim B A ∼ B ,称 P − 1 A P P^{-1}AP P − 1 A P 是对 A A A 做相似变换
很多教材中矩阵等价和相似使用的符号都是 ∼ \sim ∼ ,但是不要混淆,这两个是不同的概念,此外,一些教材中规定的等价符号为 = ∼ \stackrel {\sim}{=} = ∼ ,而相似的符号为 ∼ \sim ∼ .
设向量 x 2 , y 2 x_2,y_2 x 2 , y 2 ,这两个向量是在不同基下的同一向量,有 x 2 = P y 2 x_2=Py_2 x 2 = P y 2 某变换在这两个基下的的表示分别为矩阵 A A A 和 B B B ,矩阵 A , B A,B A , B 相似.
设 { x 2 = A x 1 y 2 = B y 1 \begin{cases} x_2=Ax_1 \\ y_2=By_1 \end{cases} { x 2 = A x 1 y 2 = B y 1 ,有
x 2 = P y 2 = P B y 1 , x 2 = A x 1 = A P y 1 → P B y 1 = A P y 1 x_2 = Py_2=PBy_1,x_2=Ax_1=APy_1 \rightarrow PBy_1=APy_1 x 2 = P y 2 = PB y 1 , x 2 = A x 1 = A P y 1 → PB y 1 = A P y 1
整理得 B y 1 = P − 1 A P y 1 → B = P − 1 A P By_1=P^{-1}APy_1 \rightarrow B=P^{-1}AP B y 1 = P − 1 A P y 1 → B = P − 1 A P
矩阵相似:同一矩阵在不同基下的表示
定理1 :若矩阵 A ∼ B A \sim B A ∼ B ,则有:
R ( A ) = R ( B ) R(A)=R(B) R ( A ) = R ( B )
∣ A ∣ = ∣ B ∣ |A|=|B| ∣ A ∣ = ∣ B ∣
∣ λ E − A ∣ = ∣ λ E − B ∣ |\lambda E-A|=|\lambda E-B| ∣ λ E − A ∣ = ∣ λ E − B ∣
t r ( A ) = t r ( B ) tr(A)=tr(B) t r ( A ) = t r ( B )
证明:
R ( A ) = R ( B ) R(A)=R(B) R ( A ) = R ( B ) :B = P − 1 A P B=P^{-1}AP B = P − 1 A P ,左乘和右乘相当于对矩阵A做初等行列变换,不改变矩阵的秩.
∣ A ∣ = ∣ B ∣ |A|=|B| ∣ A ∣ = ∣ B ∣ :∣ B ∣ = ∣ P − 1 A P ∣ = ∣ P − 1 ∣ ∣ A ∣ ∣ P ∣ = ∣ A ∣ |B|=|P^{-1}AP|=|P^{-1}||A||P|=|A| ∣ B ∣ = ∣ P − 1 A P ∣ = ∣ P − 1 ∣∣ A ∣∣ P ∣ = ∣ A ∣ ,这里补充一个知识点,∣ P − 1 ∣ = ∣ 1 P ∣ |P^{-1}|=|\frac {1}{P}| ∣ P − 1 ∣ = ∣ P 1 ∣ .
∣ λ E − A ∣ = ∣ λ E − B ∣ |\lambda E-A|=|\lambda E-B| ∣ λ E − A ∣ = ∣ λ E − B ∣ :这两个式子就是求特征值的式子,这两个式子相同意味着矩阵 A A A 和矩阵 B B B 对应的特征值是相同的,矩阵对应的行列式的值等于所有特征值的积,因此 ∣ λ E − A ∣ = ∣ λ E − B ∣ |\lambda E- A|=|\lambda E – B| ∣ λ E − A ∣ = ∣ λ E − B ∣ .
t r ( A ) = t r ( B ) tr(A)=tr(B) t r ( A ) = t r ( B ) :和上一个同理,特征值都一样,那特征值的和肯定也一样.
定理2 :若矩阵 A ∼ B A \sim B A ∼ B ,则有:
A T ∼ B T A^T \sim B^T A T ∼ B T
A − 1 ∼ B − 1 A^{-1}\sim B^{-1} A − 1 ∼ B − 1
A n ∼ B n ( n ∈ N ) A^n\sim B^n \quad (n \in N) A n ∼ B n ( n ∈ N )
A ∗ ∼ B ∗ ( A , B 可逆 ) A^* \sim B^* \quad (A,B 可逆) A ∗ ∼ B ∗ ( A , B 可逆 )
A − n E ∼ B − n E A-nE \sim B-nE A − n E ∼ B − n E
证明:
A T ∼ B T A^T \sim B^T A T ∼ B T :B T = ( P − 1 A P ) T = P T A T ( P − 1 ) T = P T A T ( P T ) − 1 B^T=(P^{-1}AP)^T=P^TA^T(P^{-1})^T=P^TA^T(P^T)^{-1} B T = ( P − 1 A P ) T = P T A T ( P − 1 ) T = P T A T ( P T ) − 1 ,把 P T P^T P T 看成一个整体,则有 A T ∼ B T A^T \sim B^T A T ∼ B T .
A − 1 ∼ B − 1 A^{-1}\sim B^{-1} A − 1 ∼ B − 1 :这条和上方两矩阵对应的转置矩阵相似证明过程同理. – A n ∼ B n ( n ∈ N ) A^n\sim B^n \quad (n \in N) A n ∼ B n ( n ∈ N ) :B n = ( P − 1 A P ) n = P − 1 A ( P P − 1 ) A ( P P − 1 ) A ⋯ ( P P − 1 ) A P = P − 1 A n P B^n=(P^{-1}AP)^n=P^{-1}A(PP^{-1})A(PP^{-1})A\cdots (PP^{-1})AP=P^{-1}A^nP B n = ( P − 1 A P ) n = P − 1 A ( P P − 1 ) A ( P P − 1 ) A ⋯ ( P P − 1 ) A P = P − 1 A n P ,则 A n ∼ B n A^n \sim B^n A n ∼ B n
A ∗ ∼ B ∗ ( A , B 可逆 ) A^* \sim B^* \quad (A,B 可逆) A ∗ ∼ B ∗ ( A , B 可逆 ) :由上面的条件得,A − 1 ∼ B − 1 A^{-1} \sim B^{-1} A − 1 ∼ B − 1 ,即 B − 1 = P − 1 A − 1 P → B ∗ ∣ B ∣ = P − 1 A ∗ ∣ A ∣ P B^{-1}=P^{-1}A^{-1}P \rightarrow \frac {B^*}{|B|}=P^{-1} \frac{A^*}{|A|} P B − 1 = P − 1 A − 1 P → ∣ B ∣ B ∗ = P − 1 ∣ A ∣ A ∗ P ,由定理1得 ∣ A ∣ = ∣ B ∣ |A|=|B| ∣ A ∣ = ∣ B ∣ ,则有 B ∗ = P − 1 A ∗ P B^*=P^{-1}A^*P B ∗ = P − 1 A ∗ P ,则 A ∗ ∼ B ∗ A^* \sim B^* A ∗ ∼ B ∗ .
A − n E ∼ B − n E A-nE \sim B-nE A − n E ∼ B − n E :P − 1 ( A − n E ) P = ( P − 1 A P ) − ( P − 1 2 E P ) = B − n E P^{-1}(A-nE)P=(P^{-1}AP)-(P^{-1}2EP)=B-nE P − 1 ( A − n E ) P = ( P − 1 A P ) − ( P − 1 2 EP ) = B − n E
例 :设 A ∼ B A \sim B A ∼ B ,且 B = [ 0 0 1 0 1 0 1 0 0 ] B=\begin{bmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0 \end{bmatrix} B = ⎣ ⎡ 0 0 1 0 1 0 1 0 0 ⎦ ⎤ ,则 R ( A − 2 E ) + R ( A − E ) = ? R(A-2E)+R(A-E)=? R ( A − 2 E ) + R ( A − E ) = ?
R ( A − 2 E ) + R ( A − E ) = R ( B − 2 E ) + R ( B − E ) R(A-2E)+R(A-E)=R(B-2E)+R(B-E) R ( A − 2 E ) + R ( A − E ) = R ( B − 2 E ) + R ( B − E )
B − 2 E = [ − 2 0 1 0 − 1 0 1 0 − 2 ] ∼ [ 1 0 − 2 0 − 1 0 0 0 − 3 ] B-2E=\begin{bmatrix} -2 & 0 & 1 \\ 0 & -1 & 0 \\ 1 & 0 & -2 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & -2 \\ 0 & -1 & 0 \\ 0 & 0 & -3 \end{bmatrix} B − 2 E = ⎣ ⎡ − 2 0 1 0 − 1 0 1 0 − 2 ⎦ ⎤ ∼ ⎣ ⎡ 1 0 0 0 − 1 0 − 2 0 − 3 ⎦ ⎤
B − E = [ − 1 0 1 0 0 0 1 0 − 1 ] ∼ [ − 1 0 1 0 0 0 0 0 0 ] B-E=\begin{bmatrix} -1 & 0 & 1 \\ 0 & 0 & 0 \\ 1 & 0 & -1 \end{bmatrix} \sim \begin{bmatrix} -1 & 0 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} B − E = ⎣ ⎡ − 1 0 1 0 0 0 1 0 − 1 ⎦ ⎤ ∼ ⎣ ⎡ − 1 0 0 0 0 0 1 0 0 ⎦ ⎤
则 R ( B − 2 E ) + R ( B − E ) = 4 R(B-2E)+R(B-E)=4 R ( B − 2 E ) + R ( B − E ) = 4
故 R ( A − 2 E ) + R ( A − E ) = 4 R(A-2E)+R(A-E)=4 R ( A − 2 E ) + R ( A − E ) = 4
相似对角化
定义 :若矩阵 A A A 能与对角阵 Λ \Lambda Λ 相似,则称矩阵 A A A 可相似对角化,记作 A ∼ Λ A \sim \Lambda A ∼ Λ ,称 Λ \Lambda Λ 是 A A A 的相似标准形.
P − 1 A P = Λ ⟶ 两边左乘 P A P = P Λ ( 将 P 按列分块 P = [ η 1 , η 2 , ⋯ , η n ] ) P^{-1}AP=\Lambda \stackrel {两边左乘P}{\longrightarrow} AP=P\Lambda \quad (将P按列分块 P=[\eta_1,\eta_2,\cdots,\eta_n]) P − 1 A P = Λ ⟶ 两边左乘 P A P = P Λ ( 将 P 按列分块 P = [ η 1 , η 2 , ⋯ , η n ])
A P = A [ η 1 η 2 ⋯ η n ] = [ A η 1 A η 2 ⋯ A η n ] AP=A\begin{bmatrix} \eta_1 & \eta_2 \cdots & \eta_n \end{bmatrix} = \begin{bmatrix} A\eta_1 & A\eta_2 \cdots & A\eta_n \end{bmatrix} A P = A [ η 1 η 2 ⋯ η n ] = [ A η 1 A η 2 ⋯ A η n ]
例 :A = [ a 11 a 12 a 21 a 22 ] , B A=\begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix},B A = [ a 11 a 21 a 12 a 22 ] , B (按列分块) = [ η 1 η 2 ] , A B = [ A η 1 A η 2 ] =\begin{bmatrix} \eta_{1} & \eta_{2} \end{bmatrix},AB=\begin{bmatrix} A\eta_1 & A\eta_2 \end{bmatrix} = [ η 1 η 2 ] , A B = [ A η 1 A η 2 ]
这里是把矩阵 A A A 看成一个整体 (分块)
[ a 11 a 12 a 21 a 22 ] [ b 11 b 12 b 21 b 22 ] = [ a 11 a 12 a 21 a 22 ] [ η 1 η 2 ] = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix}\begin{bmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{bmatrix} = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix}\begin{bmatrix} \eta_{1} & \eta_{2} \end{bmatrix} = [ a 11 a 21 a 12 a 22 ] [ b 11 b 21 b 12 b 22 ] = [ a 11 a 21 a 12 a 22 ] [ η 1 η 2 ] =
[ [ a 11 a 12 ] η 1 [ a 11 a 12 ] η 2 [ a 21 a 22 ] η 1 [ a 21 a 22 ] η 2 ] = [ [ a 11 a 12 a 21 a 22 ] η 1 [ a 11 a 12 a 21 a 22 ] η 2 ] \begin{bmatrix} \begin{bmatrix} a_{11} & a_{12} \end{bmatrix}\eta_1 & \begin{bmatrix} a_{11} & a_{12} \end{bmatrix}\eta_2 \\ \begin{bmatrix} a_{21} & a_{22} \end{bmatrix}\eta_1 & \begin{bmatrix} a_{21} & a_{22} \end{bmatrix}\eta_2 \end{bmatrix} = \begin{bmatrix} \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix}\eta_1 & \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix}\eta_2 \end{bmatrix} [ [ a 11 a 12 ] η 1 [ a 21 a 22 ] η 1 [ a 11 a 12 ] η 2 [ a 21 a 22 ] η 2 ] = [ [ a 11 a 21 a 12 a 22 ] η 1 [ a 11 a 21 a 12 a 22 ] η 2 ]
P Λ = [ η 1 η 2 ⋯ η n ] [ λ 1 λ 2 ⋯ λ n ] = [ η 1 λ 1 η 2 λ 2 ⋯ η n λ n ] P\Lambda = \begin{bmatrix} \eta_1 & \eta_2 \cdots & \eta_n \end{bmatrix}\begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \cdots & \\ & & & \lambda_n \end{bmatrix} = \begin{bmatrix} \eta_1\lambda_1 & \eta_2\lambda_2 & \cdots \eta_n\lambda_n \end{bmatrix} P Λ = [ η 1 η 2 ⋯ η n ] ⎣ ⎡ λ 1 λ 2 ⋯ λ n ⎦ ⎤ = [ η 1 λ 1 η 2 λ 2 ⋯ η n λ n ]
由 A P = P Λ AP=P\Lambda A P = P Λ 得 [ A η 1 A η 2 ⋯ A η n ] = [ η 1 λ 1 η 2 λ 2 ⋯ η n λ n ] \begin{bmatrix} A\eta_1 & A\eta_2 \cdots & A\eta_n \end{bmatrix}=\begin{bmatrix} \eta_1\lambda_1 & \eta_2\lambda_2 & \cdots \eta_n\lambda_n \end{bmatrix} [ A η 1 A η 2 ⋯ A η n ] = [ η 1 λ 1 η 2 λ 2 ⋯ η n λ n ]
则有:{ A η 1 = η 1 λ 1 A η 2 = η 2 λ 2 ⋮ A η n = η n λ n \begin{cases} A\eta_1 = \eta_1\lambda_1 \\ A\eta_2 = \eta_2\lambda_2 \\ \qquad \vdots \\ A\eta_n=\eta_n\lambda_n \end{cases} ⎩ ⎨ ⎧ A η 1 = η 1 λ 1 A η 2 = η 2 λ 2 ⋮ A η n = η n λ n
这些式子就是前面的特征值特征向量的定义 A x = λ x Ax=\lambda x A x = λ x
结论 :所以要想矩阵 A A A 和对角阵相似的话,对角阵中的元素必须是 A A A 的特征值,矩阵 P P P 中的列向量为矩阵 A A A 的特征值对应的特征向量.
定理1 :n n n 阶方阵 A A A 可对角化的充要条件是 A A A 有 n n n 个线性无关的特征向量.
推论 :若 A A A 有 n n n 个不同的特征值,则 A A A 一定可以相似对角化
补充 :不同特征值对应的特征向量线性无关,相同特征值(重数大于1)对应的特征向量不保证一定线性无关。
从几何上理解,向量表示的是矩阵变换中只有伸缩变换没有旋转变换的方向向量,特征值是这个方向的伸缩系数,一个方向当然只有一个伸缩系数。
定理2 :n n n 阶矩阵 A A A 与对角矩阵相似的充要条件是 A A A 的每个特征值对应的特征向量线性无关的个数等于该特征值的重数.
当重数大于1时,意味着可能有相同的特征值,”每个特征值对应的特征向量线性无关的个数等于该特征值的重数” 这句话意味着当特征值相同时,对应的特征向量仍然是线性无关的.
例 :设矩阵 A = [ − 2 1 1 0 2 0 − 4 1 3 ] A=\begin{bmatrix} -2 & 1 & 1 \\ 0 & 2 & 0 \\ -4 & 1 & 3 \end{bmatrix} A = ⎣ ⎡ − 2 0 − 4 1 2 1 1 0 3 ⎦ ⎤ ,问 A A A 能否对角化?若能,则求可逆矩阵 P P P 和对角矩阵 Λ \Lambda Λ ,使 P − 1 A P = Λ P^{-1}AP=\Lambda P − 1 A P = Λ .
假设矩阵 A A A 能对角化.
∣ A − λ E ∣ = ∣ − 2 − λ 1 1 0 2 − λ 0 − 4 1 3 − λ ∣ = ( 2 − λ ) ( − 1 ) 2 + 2 ∣ − 2 − λ 1 − 4 3 − λ ∣ = ( 2 − λ ) ( λ + 1 ) ( λ − 2 ) = 0 |A-\lambda E| = \begin{vmatrix} -2-\lambda & 1 & 1 \\ 0 & 2-\lambda & 0 \\ -4 & 1 & 3-\lambda \end{vmatrix} = (2-\lambda)(-1)^{2+2}\begin{vmatrix} -2 – \lambda & 1 \\ -4 & 3-\lambda \end{vmatrix}=(2-\lambda)(\lambda + 1)(\lambda – 2)=0 ∣ A − λ E ∣ = ∣ ∣ − 2 − λ 0 − 4 1 2 − λ 1 1 0 3 − λ ∣ ∣ = ( 2 − λ ) ( − 1 ) 2 + 2 ∣ ∣ − 2 − λ − 4 1 3 − λ ∣ ∣ = ( 2 − λ ) ( λ + 1 ) ( λ − 2 ) = 0
则 { λ 1 = − 1 λ 2 = λ 3 = 2 \begin{cases} \lambda_1 = -1\\ \lambda_2=\lambda_3=2 \end{cases} { λ 1 = − 1 λ 2 = λ 3 = 2
当 λ 2 = λ 3 = 2 \lambda_2 = \lambda_3 = 2 λ 2 = λ 3 = 2 时,A − 2 E = [ − 4 1 1 0 0 0 − 4 1 1 ] ∼ [ − 4 1 1 0 0 0 0 0 0 ] A-2E=\begin{bmatrix} -4 & 1 & 1 \\ 0 & 0 & 0 \\ -4 & 1 & 1\end{bmatrix} \sim \begin{bmatrix} -4 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} A − 2 E = ⎣ ⎡ − 4 0 − 4 1 0 1 1 0 1 ⎦ ⎤ ∼ ⎣ ⎡ − 4 0 0 1 0 0 1 0 0 ⎦ ⎤
由基础解系易得两个解:p 2 = [ 1 4 1 0 ] , p 3 = [ 1 4 0 1 ] p_2 =\begin{bmatrix} \frac 1 4 \\ 1 \\ 0 \end{bmatrix},p_3 = \begin{bmatrix} \frac 1 4 \\ 0 \\ 1 \end{bmatrix} p 2 = ⎣ ⎡ 4 1 1 0 ⎦ ⎤ , p 3 = ⎣ ⎡ 4 1 0 1 ⎦ ⎤ ,易得这两个向量构成的向量组线性无关
同理当 λ 1 = − 1 \lambda_1 = -1 λ 1 = − 1 时,得到 p 1 = [ 1 0 1 ] p_1=\begin{bmatrix} 1 \\ 0 \\ 1\end{bmatrix} p 1 = ⎣ ⎡ 1 0 1 ⎦ ⎤
则矩阵 A A A 可对角化
易得对角阵 Λ = [ − 1 2 2 ] \Lambda=\begin{bmatrix} -1 & & \\ & 2 & \\ & & 2 \end{bmatrix} Λ = ⎣ ⎡ − 1 2 2 ⎦ ⎤ ,可逆矩阵 P = [ 1 1 4 1 4 0 1 0 1 0 1 ] P=\begin{bmatrix} 1 & \frac 1 4 & \frac 1 4 \\ 0 & 1 & 0 \\1 & 0 & 1 \end{bmatrix} P = ⎣ ⎡ 1 0 1 4 1 1 0 4 1 0 1 ⎦ ⎤
对角阵和可逆矩阵答案不唯一,λ 1 , λ 2 , λ 3 \lambda_1,\lambda_2,\lambda_3 λ 1 , λ 2 , λ 3 哪两个为2,哪个为1,顺序不确定,因此最终得到的对角阵和可逆矩阵中的顺序也可能不同,答案不唯一.
例 :设矩阵 A = [ 2 0 1 3 1 x 4 0 5 ] A=\begin{bmatrix} 2 & 0 & 1 \\ 3 & 1 & x \\ 4 & 0 & 5 \end{bmatrix} A = ⎣ ⎡ 2 3 4 0 1 0 1 x 5 ⎦ ⎤ 可相似对角化,求 x x x .
∣ A − λ E ∣ = ∣ 2 − λ 0 1 3 1 − λ x 4 0 5 − λ ∣ = ( 1 − λ ) ( − 1 ) 2 + 2 ∣ 2 − λ 1 4 5 − λ ∣ |A-\lambda E|=\begin{vmatrix} 2-\lambda & 0 & 1 \\ 3 & 1-\lambda & x \\ 4 & 0 & 5-\lambda \end{vmatrix} = (1-\lambda)(-1)^{2+2}\begin{vmatrix} 2-\lambda & 1 \\ 4 & 5-\lambda \end{vmatrix} ∣ A − λ E ∣ = ∣ ∣ 2 − λ 3 4 0 1 − λ 0 1 x 5 − λ ∣ ∣ = ( 1 − λ ) ( − 1 ) 2 + 2 ∣ ∣ 2 − λ 4 1 5 − λ ∣ ∣
= ( 1 − λ ) ( λ − 1 ) ( λ − 6 ) = 0 =(1-\lambda)(\lambda-1)(\lambda-6) = 0 = ( 1 − λ ) ( λ − 1 ) ( λ − 6 ) = 0
解得 { λ 1 = λ 2 = 1 λ 3 = 6 \begin{cases} \lambda_1 =\lambda_2 = 1 \\ \lambda_3 = 6 \end{cases} { λ 1 = λ 2 = 1 λ 3 = 6
当 λ 1 = λ 2 = 1 \lambda_1 = \lambda_2 = 1 λ 1 = λ 2 = 1 时,A − λ E = [ 1 0 1 3 0 x 4 0 4 ] ∼ [ 1 0 1 0 0 x − 3 0 0 0 ] A-\lambda E=\begin{bmatrix} 1 & 0 & 1 \\ 3 & 0 & x \\ 4 & 0 & 4 \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & 1 \\ 0 & 0 & x-3 \\ 0 & 0 & 0 \end{bmatrix} A − λ E = ⎣ ⎡ 1 3 4 0 0 0 1 x 4 ⎦ ⎤ ∼ ⎣ ⎡ 1 0 0 0 0 0 1 x − 3 0 ⎦ ⎤
由于矩阵 A A A 可相似对角化,因此齐次方程组 ( A − E ) x = 0 (A-E)x=0 ( A − E ) x = 0 一定有2个线性无关解
则 3 − R ( A − E ) = 2 3-R(A-E)=2 3 − R ( A − E ) = 2 ,R ( A − E ) = 1 R(A-E)=1 R ( A − E ) = 1
线性无关解个数 = 自由变量个数 = n − R ( 系数矩阵 ) n-R(系数矩阵) n − R ( 系数矩阵 )
即 x − 3 = 0 → x = 3 x-3=0 \rightarrow x=3 x − 3 = 0 → x = 3 .
对称矩阵的相似对角化
对称矩阵 :A T = A A^T=A A T = A ,实对称矩阵,也就是矩阵元素都为实数
我们不研究 虚对称矩阵
性质1 :实对称矩阵的特征值为实数
性质2 :实对称矩阵 A A A 对应于不同特征值的特征向量相互正交
性质3 :n n n 阶实对称矩阵 A A A 必可相似对角化,且总存在正交矩阵 Q Q Q ,使得 Q T A Q = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) Q^TAQ=diag(\lambda_1,\lambda_2,\cdots,\lambda_n) Q T A Q = d ia g ( λ 1 , λ 2 , ⋯ , λ n ) ,其中 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ 1 , λ 2 , ⋯ , λ n 是矩阵 A A A 的特征值.
d i a g ( λ 1 , λ 2 , ⋯ , λ n ) diag(\lambda_1,\lambda_2,\cdots,\lambda_n) d ia g ( λ 1 , λ 2 , ⋯ , λ n ) :对角阵,正对角线元素按顺序分别为 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ 1 , λ 2 , ⋯ , λ n .
例 :设 A A A 是三阶实对称矩阵,其特征值为 λ 1 = 6 , λ 2 = λ 3 = 3 \lambda_1=6, \lambda_2=\lambda_3=3 λ 1 = 6 , λ 2 = λ 3 = 3 ,其特征值 3 3 3 对应的特征向量为 ξ 2 = [ − 1 , 0 , 1 ] T , ξ 3 = [ 1 , − 2 , 1 ] T \xi_2=[-1, 0, 1]^T,\xi_3=[1,-2,1]^T ξ 2 = [ − 1 , 0 , 1 ] T , ξ 3 = [ 1 , − 2 , 1 ] T ,求矩阵 A A A 的对应于特征值 6 6 6 的特征向量及矩阵 A A A .
设 ξ 1 = [ x 1 , x 2 , x 3 ] T \xi_1=[x_1,x_2,x_3]^T ξ 1 = [ x 1 , x 2 , x 3 ] T ,由于 A A A 为三阶实对称矩阵,则有 { ( ξ 1 , ξ 2 ) = 0 ( ξ 1 , ξ 3 ) = 0 \begin{cases} (\xi_1,\xi_2)=0 \\ (\xi_1,\xi_3)=0 \end{cases} { ( ξ 1 , ξ 2 ) = 0 ( ξ 1 , ξ 3 ) = 0
即 { − x 1 + x 3 = 0 x 1 − 2 x 2 + x 3 = 0 \begin{cases} -x_1+x_3=0 \\ x_1-2x_2+x_3 = 0 \end{cases} { − x 1 + x 3 = 0 x 1 − 2 x 2 + x 3 = 0 ,易得系数矩阵:[ − 1 0 1 1 − 2 1 ] ∼ [ − 1 0 1 0 − 2 2 ] \begin{bmatrix} -1 & 0 & 1 \\ 1 & -2 & 1 \end{bmatrix} \sim \begin{bmatrix} -1 & 0 & 1 \\ 0 & -2 & 2 \end{bmatrix} [ − 1 1 0 − 2 1 1 ] ∼ [ − 1 0 0 − 2 1 2 ]
易得主元为 x 1 , x 2 x_1,x_2 x 1 , x 2 ,基础解系:ξ 1 = [ 1 , 1 , 1 ] T \xi_1=[1,1,1]^T ξ 1 = [ 1 , 1 , 1 ] T
则 Q = [ ξ 1 ξ 2 ξ 3 ] = [ 1 − 1 1 1 0 − 2 1 1 1 ] Q=\begin{bmatrix} \xi_1 & \xi_2 & \xi_3 \end{bmatrix} = \begin{bmatrix} 1 & -1 & 1 \\ 1 & 0 & -2 \\ 1 & 1 & 1 \end{bmatrix} Q = [ ξ 1 ξ 2 ξ 3 ] = ⎣ ⎡ 1 1 1 − 1 0 1 1 − 2 1 ⎦ ⎤
由 Q − 1 A Q = Λ Q^{-1}AQ=\Lambda Q − 1 A Q = Λ 得:A = Q Λ Q − 1 ( 两边分别左乘 Q − 1 和右乘 Q ) A=Q\Lambda Q^{-1} \quad (两边分别左乘Q^{-1}和右乘Q) A = Q Λ Q − 1 ( 两边分别左乘 Q − 1 和右乘 Q )
有 A = [ 1 − 1 1 1 0 − 2 1 1 1 ] [ 6 3 3 ] [ 1 − 1 1 1 0 − 2 1 1 1 ] − 1 = [ 4 1 1 1 4 1 1 1 4 ] A=\begin{bmatrix} 1 & -1 & 1 \\ 1 & 0 & -2 \\ 1 & 1 & 1 \end{bmatrix}\begin{bmatrix} 6 & & \\ & 3 & \\ & & 3 \end{bmatrix}\begin{bmatrix} 1 & -1 & 1 \\ 1 & 0 & -2 \\ 1 & 1 & 1 \end{bmatrix}^{-1}=\begin{bmatrix} 4 & 1 & 1 \\ 1 & 4 & 1 \\ 1 & 1 & 4 \end{bmatrix} A = ⎣ ⎡ 1 1 1 − 1 0 1 1 − 2 1 ⎦ ⎤ ⎣ ⎡ 6 3 3 ⎦ ⎤ ⎣ ⎡ 1 1 1 − 1 0 1 1 − 2 1 ⎦ ⎤ − 1 = ⎣ ⎡ 4 1 1 1 4 1 1 1 4 ⎦ ⎤
最后这步就硬算,计算过程有点麻烦,但思路很简单,算出来就好了
例 :设三阶实对称矩阵 A A A 的各行元素之和为 3 ,向量 α 1 = [ − 1 , 2 , − 1 ] T , α 2 = [ 0 , − 1 , 1 ] T \alpha_1=[-1,2,-1]^T,\alpha_2=[0,-1,1]^T α 1 = [ − 1 , 2 , − 1 ] T , α 2 = [ 0 , − 1 , 1 ] T 是方程组 A x = 0 ( 0 为零向量 ) Ax=0 (0为零向量) A x = 0 ( 0 为零向量 ) 的两个解,(1) 求 A A A 的特征值和特征向量;(2) 求正交矩阵 Q Q Q 和对角矩阵 Λ \Lambda Λ ,使得 Q − 1 A Q = Λ Q^{-1}AQ=\Lambda Q − 1 A Q = Λ .
(1) 求 A A A 的特征值和特征向量.
已知三阶实对称矩阵 A A A 的个行元素之和为3
则 A [ 1 1 1 ] = 3 [ 1 1 1 ] A\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} = 3\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} A ⎣ ⎡ 1 1 1 ⎦ ⎤ = 3 ⎣ ⎡ 1 1 1 ⎦ ⎤ ,即 A α = λ α , α = [ 1 1 1 ] A\alpha=\lambda \alpha,\quad \alpha=\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} A α = λ α , α = ⎣ ⎡ 1 1 1 ⎦ ⎤
易得 特征值λ 3 \lambda_3 λ 3 为 3 3 3 ,对应的特征向量为 α 3 = [ 1 1 1 ] \alpha_3=\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} α 3 = ⎣ ⎡ 1 1 1 ⎦ ⎤
易得 A = [ α 1 α 2 α 3 ] = [ − 1 0 1 2 − 1 1 − 1 1 1 ] A=\begin{bmatrix} \alpha_1 & \alpha_2 & \alpha_3 \end{bmatrix} = \begin{bmatrix} -1 & 0 & 1 \\ 2 & -1 & 1 \\ -1 & 1 & 1 \end{bmatrix} A = [ α 1 α 2 α 3 ] = ⎣ ⎡ − 1 2 − 1 0 − 1 1 1 1 1 ⎦ ⎤
已知向量 α 1 = [ − 1 , 2 , − 1 ] T , α 2 = [ 0 , − 1 , 1 ] T \alpha_1=[-1,2,-1]^T,\alpha_2=[0,-1,1]^T α 1 = [ − 1 , 2 , − 1 ] T , α 2 = [ 0 , − 1 , 1 ] T 都是方程组 A x = 0 Ax=0 A x = 0 的解
则有 A α 1 = 0 = 0 α 1 , A α 2 = 0 α 2 A\alpha_1 = 0 = 0\alpha_1,A\alpha_2=0\alpha_2 A α 1 = 0 = 0 α 1 , A α 2 = 0 α 2
则特征向量对应的特征值有 λ 1 = λ 2 = 0 \lambda_1=\lambda_2=0 λ 1 = λ 2 = 0
即 A A A 特征值:{ λ 1 = λ 2 = 0 λ 3 = 3 \begin{cases} \lambda_1=\lambda_2=0 \\ \lambda_3=3 \end{cases} { λ 1 = λ 2 = 0 λ 3 = 3 ,特征向量:α 1 = [ − 1 2 − 1 ] , α 2 = [ 0 − 1 1 ] , α 3 = [ 1 1 1 ] \alpha_1=\begin{bmatrix} -1 \\ 2 \\ -1 \end{bmatrix},\alpha_2=\begin{bmatrix} 0 \\ -1 \\ 1 \end{bmatrix},\alpha_3=\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} α 1 = ⎣ ⎡ − 1 2 − 1 ⎦ ⎤ , α 2 = ⎣ ⎡ 0 − 1 1 ⎦ ⎤ , α 3 = ⎣ ⎡ 1 1 1 ⎦ ⎤
(2) 求正交矩阵 Q Q Q 和对角矩阵 Λ \Lambda Λ ,使得 Q − 1 A Q = Λ Q^{-1}AQ=\Lambda Q − 1 A Q = Λ .
易得对角阵 Λ = [ 0 0 3 ] \Lambda=\begin{bmatrix} 0 & & \\ & 0 & \\ & & 3 \end{bmatrix} Λ = ⎣ ⎡ 0 0 3 ⎦ ⎤
已知矩阵 A A A 不同特征值对应的特征向量相互正交,即 α 3 \alpha_3 α 3 分别与 α 1 , α 2 \alpha_1,\alpha_2 α 1 , α 2 正交
令 β 1 = α 1 \beta_1 = \alpha_1 β 1 = α 1 ,由施密特正交法得:
β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 = 1 2 [ − 1 0 1 ] , β 3 = α 3 = [ 1 1 1 ] \beta_2 = \alpha_2 – \frac {(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1=\frac {1}{2}\begin{bmatrix} -1 \\ 0 \\ 1 \end{bmatrix},\beta_3=\alpha_3=\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} β 2 = α 2 − ( β 1 , β 1 ) ( α 2 , β 1 ) β 1 = 2 1 ⎣ ⎡ − 1 0 1 ⎦ ⎤ , β 3 = α 3 = ⎣ ⎡ 1 1 1 ⎦ ⎤
则 r 1 = β 1 ∣ ∣ β 1 ∣ ∣ = 1 6 [ − 1 2 − 1 ] r_1=\frac {\beta_1}{||\beta_1||}=\frac {1}{\sqrt 6}\begin{bmatrix} -1 \\ 2 \\ -1 \end{bmatrix} r 1 = ∣∣ β 1 ∣∣ β 1 = 6 1 ⎣ ⎡ − 1 2 − 1 ⎦ ⎤ ,同理 r 2 = 1 2 [ − 1 0 1 ] , r 3 = 1 3 [ 1 1 1 ] r_2=\frac {1}{\sqrt 2}\begin{bmatrix} -1 \\ 0 \\ 1 \end{bmatrix},r_3=\frac {1}{\sqrt 3}\begin{bmatrix} 1 \\ 1 \\ 1 \end{bmatrix} r 2 = 2 1 ⎣ ⎡ − 1 0 1 ⎦ ⎤ , r 3 = 3 1 ⎣ ⎡ 1 1 1 ⎦ ⎤
则 正交矩阵 Q = [ r 1 r 2 r 3 ] Q=\begin{bmatrix} r_1 & r_2 & r_3 \end{bmatrix} Q = [ r 1 r 2 r 3 ]
正交矩阵需要向量互相正交且模都为1,前面提到实对称矩阵不同特征值相互正交,因此这里只需要保证特征值相同时的连个特征向量相互正交即可,规范化特征向量后得到该正交矩阵 Q Q Q .