在讨论特征值、特征向量 和对角化 之前,我们先提供一些动机。
从这个例子可以看出,对于一些特殊的矩阵,它们的幂可以通过以下形式方便地计算出来: P D P − 1 {\displaystyle PDP^{-1}} ,其中 P {\displaystyle P} 是可逆矩阵, D {\displaystyle D} 是对角矩阵。
当然,给定一个矩阵,我们会想知道它是否可以表示为 P D P − 1 {\displaystyle PDP^{-1}} 的形式,如果可以, P {\displaystyle P} 和 D {\displaystyle D} 是什么,以便我们可以方便地计算它的幂。 这是本章的主要目标。
鉴于动机部分,我们有以下定义。
练习。
以下是与对角化在某种程度上相关的重要的通用概念。
练习。
以下定理将可对角化矩阵与特征向量和特征值联系起来。
定理。 (对角化) 设 A {\displaystyle A} 是一个 n × n {\displaystyle n\times n} 矩阵。那么, A {\displaystyle A} 是 可对角化 的当且仅当 A {\displaystyle A} 具有 n {\displaystyle n} 个 线性无关特征向量 。如果 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 是 A {\displaystyle A} 的 线性无关特征向量 ,对应于 特征值 λ 1 , … , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}} (其中一些可能是相同的),我们可以 定义 一个 可逆 矩阵 P {\displaystyle P} ,其 列 为 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} ,以及一个 对角 矩阵 D {\displaystyle D} ,其 对角元素 为 λ 1 , … , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}} ,使得 A = P D P − 1 . {\displaystyle A=PDP^{-1}.}
证明。 以下我们使用 ( v 1 ⋯ v n ) {\displaystyle {\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}} 来表示以 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 为列向量,按此顺序排列的矩阵。 A = P D P − 1 ⇔ A P = P D P P − 1 ⏟ I ⇔ A ( v 1 ⋯ v n ) = ( v 1 ⋯ v n ) ( λ 1 0 ⋯ 0 0 λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n ) ⇔ ( A v 1 ⋯ A v n ) = ( λ 1 v 1 ⋯ λ n v n ) ⇔ A v 1 = λ 1 v 1 , … , A v n = λ n v n . {\displaystyle {\begin{aligned}&&A&=PDP^{-1}\\&\Leftrightarrow &AP&=PD\underbrace {PP^{-1}} _{I}\\&\Leftrightarrow &A{\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}{\begin{pmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{pmatrix}}\\&\Leftrightarrow &{\begin{pmatrix}A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\lambda _{1}\mathbf {v} _{1}&\cdots &\lambda _{n}\mathbf {v} _{n}\end{pmatrix}}\\&\Leftrightarrow &A\mathbf {v} _{1}&=\lambda _{1}\mathbf {v} _{1},\ldots ,A\mathbf {v} _{n}=\lambda _{n}\mathbf {v} _{n}.\end{aligned}}} 我们现在已经证明了 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 是 特征向量 。 现在剩下要证明的是它们是 线性无关 的,这可以通过以下论据证明:它们是 线性无关 当且仅当 P {\displaystyle P} 可逆,根据可逆性与线性无关的关系命题可知。 ◻ {\displaystyle \Box }
接下来,我们将介绍一种方便的方法来找到 特征值 。在此之前,我们先介绍一个与这种寻找特征值的方法相关的术语。
示例. ( 1 2 4 4 5 2 0 0 9 ) {\displaystyle {\begin{pmatrix}1&2&4\\4&5&2\\0&0&9\\\end{pmatrix}}} 的特征多项式 是 | 1 − t 2 4 4 5 − t 2 0 0 9 − t | = ( 9 − t ) | 1 − t 2 4 5 − t | = ( 9 − t ) [ ( 1 − t ) ( 5 − t ) − 2 ( 4 ) ] = − x 3 + 15 x 2 − 51 x − 27. {\displaystyle {\begin{vmatrix}1-t&2&4\\4&5-t&2\\0&0&9-t\\\end{vmatrix}}=(9-t){\begin{vmatrix}1-t&2\\4&5-t\\\end{vmatrix}}=(9-t)[(1-t)(5-t)-2(4)]=-x^{3}+15x^{2}-51x-27.} .
证明. λ is an eigenvalue of A ⇔ A v = λ v for some v ≠ 0 ⇔ ( A − λ I n ) v = 0 for some v ≠ 0 ⇔ A − λ I n is non-invertible by simplified invertible matrix theorem ⇔ det ( A − λ I n ) = 0 {\displaystyle {\begin{aligned}&&\lambda {\text{ is an }}&{\text{eigenvalue of }}A\\&\Leftrightarrow &A\mathbf {v} &=\lambda \mathbf {v} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &(A-\lambda I_{n})\mathbf {v} &=\mathbf {0} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &A-\lambda I_{n}&{\text{ is non-invertible}}\qquad {\text{by simplified invertible matrix theorem}}\\&\Leftrightarrow &\det(A-\lambda I_{n})&=0\end{aligned}}} .
◻ {\displaystyle \Box }
接下来,我们将介绍一个与特征向量 相关的概念。
练习。
在介绍了这些术语和概念之后,我们有以下用于对 n × n {\displaystyle n\times n} 矩阵进行对角化的算法步骤
通过求解 det ( A − λ I ) = 0 {\displaystyle \det(A-\lambda I)=0} 计算 A {\displaystyle A} 的所有 特征值
对于矩阵 A {\displaystyle A} 的每个特征值 λ 1 , … , λ k {\displaystyle \lambda _{1},\ldots ,\lambda _{k}} ,找到对应 特征空间 E λ 1 , … , E λ k {\displaystyle E_{\lambda _{1}},\ldots ,E_{\lambda _{k}}} 的 基 β 1 , … , β k {\displaystyle \beta _{1},\ldots ,\beta _{k}} 。
如果 β 1 , … , β k {\displaystyle \beta _{1},\ldots ,\beta _{k}} 包含 n {\displaystyle n} 个向量 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} (如果没有,则 A {\displaystyle A} 不可对角化),定义 P = ( v 1 ⋯ v n ) {\displaystyle P={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}}
我们有 A = P D P − 1 {\displaystyle A=PDP^{-1}} ,其中 D {\displaystyle D} 是一个 对角 矩阵,其 对角 元素是对应于 v 1 , … , v n {\displaystyle \mathbf {v} _{1},\ldots ,\mathbf {v} _{n}} 的 特征值 。
例子。 ( 2 × 2 {\displaystyle 2\times 2} 矩阵的对角化) 回忆一下动机部分的例子,给定矩阵 A = ( 19 − 8 48 − 21 ) {\displaystyle A={\begin{pmatrix}19&-8\\48&-21\\\end{pmatrix}}} 是可对角化的,并且它的 P D P − 1 {\displaystyle PDP^{-1}} 形式的表达式也被给出。我们将使用上述过程来推导出给定的表达式。
首先, | 19 − λ − 8 48 − 21 − λ | = 0 ⟺ ( 19 − λ ) ( − 21 − λ ) + 8 ( 48 ) = 0 ⟹ λ 2 + 2 λ − 15 = 0 ⟺ λ = 3 or λ = − 5. {\displaystyle {\begin{vmatrix}19-\lambda &-8\\48&-21-\lambda \end{vmatrix}}=0\iff (19-\lambda )(-21-\lambda )+8(48)=0\implies \lambda ^{2}+2\lambda -15=0\iff \lambda =3{\text{ or }}\lambda =-5.} 所以,矩阵的特征值为 λ = 3 {\displaystyle \lambda =3} 和 λ = − 5 {\displaystyle \lambda =-5} .
对于特征值 λ = 3 {\displaystyle \lambda ={\color {green}3}} ,因为 ( A − 3 I ) x = 0 ⟹ ( 16 − 8 48 − 24 ) x = 0 {\displaystyle (A-3I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}16&-8\\48&-24\\\end{pmatrix}}\mathbf {x} =\mathbf {0} } ,并且可以证明其通解为 x = ( a , 2 a ) T {\displaystyle \mathbf {x} =(a,2a)^{T}} ,因此 E 3 {\displaystyle E_{3}} 的基为 { ( 1 , 2 ) T } {\displaystyle \{{\color {green}(1,2)^{T}}\}}
对于特征值 λ = − 5 {\displaystyle \lambda ={\color {blue}-5}} ,因为 ( A + 5 I ) x = 0 ⟹ ( 24 − 8 48 − 16 ) x = 0 {\displaystyle (A+5I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}24&-8\\48&-16\\\end{pmatrix}}\mathbf {x} =\mathbf {0} } ,并且可以证明其通解为 x = ( b , 3 b ) T {\displaystyle \mathbf {x} =(b,3b)^{T}} ,因此 E − 5 {\displaystyle E_{-5}} 的基为 { ( 1 , 3 ) T } {\displaystyle \{{\color {blue}(1,3)^{T}}\}}
然后,我们令 P = ( 1 1 2 3 ) {\displaystyle P={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}} (因为两个基底加起来包含两个向量),并且 D = ( 3 0 0 − 5 ) . {\displaystyle D={\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}.} 然后,我们可以计算得到 P − 1 = ( 3 − 1 − 2 1 ) . {\displaystyle P^{-1}={\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}.} 因此,我们有 A = P D P − 1 = ( 1 1 2 3 ) ( 3 0 0 − 5 ) ( 3 − 1 − 2 1 ) , {\displaystyle A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}{\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}{\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}},} 这与动机部分示例中给出的形式相同。一般来说,如果我们有 A = P D P − 1 {\displaystyle A=PDP^{-1}} , A n = P D n P − 1 , {\displaystyle A^{n}=PD^{n}P^{-1},} 这在动机部分的示例中有所说明。从动机部分的示例来看, A n = ( 3 n + 1 − 2 ( − 5 ) n ( − 5 ) n − 3 n 6 ( 3 n ) − 6 ( − 5 ) n 3 ( − 5 ) n − 2 ( 3 n ) ) . {\displaystyle A^{n}={\begin{pmatrix}3^{n+1}-2(-5)^{n}&(-5)^{n}-3^{n}\\6(3^{n})-6(-5)^{n}&3(-5)^{n}-2(3^{n})\\\end{pmatrix}}.}
示例: ( 3 × 3 {\displaystyle 3\times 3} 矩阵的对角化)考虑矩阵 A = ( 0 0 1 0 1 0 1 0 0 ) {\displaystyle A={\begin{pmatrix}0&0&1\\0&1&0\\1&0&0\\\end{pmatrix}}} (它不是 I 3 {\displaystyle I_{3}} )。我们希望找到一个关于 A n {\displaystyle A^{n}} 的公式。首先, | − λ 0 1 0 1 − λ 0 1 0 − λ | = 0 ⟹ λ 2 ( 1 − λ ) − ( 1 − λ ) = 0 ⟹ ( 1 − λ ) ( λ 2 − 1 ) = 0 ⟹ λ = 1 (repeated) or λ = − 1. {\displaystyle {\begin{vmatrix}-\lambda &0&1\\0&1-\lambda &0\\1&0&-\lambda \end{vmatrix}}=0\implies \lambda ^{2}(1-\lambda )-(1-\lambda )=0\implies (1-\lambda )(\lambda ^{2}-1)=0\implies \lambda =1{\text{(repeated) or }}\lambda =-1.} 因此,矩阵的特征值为 λ = 1 {\displaystyle \lambda =1} 和 λ = − 1 {\displaystyle \lambda =-1} 。
对于特征值 λ = 1 {\displaystyle \lambda ={\color {green}1}} ,由于 ( A − I ) x = 0 ⟹ ( − 1 0 1 0 0 0 1 0 − 1 ) x = 0 ⟹ x = ( b , a , b ) T = b ( 1 , 0 , 1 ) T + a ( 0 , 1 , 0 ) T , {\displaystyle (A-I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}-1&0&1\\0&0&0\\1&0&-1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(b,a,b)^{T}=b(1,0,1)^{T}+a(0,1,0)^{T},} (有两个独立的未知数,所以每个特征空间的基的维数是 2 {\displaystyle 2} ,即每个基应该有两个向量), E 1 {\displaystyle E_{1}} 的一个基是 { ( 1 , 0 , 1 ) T , ( 0 , 1 , 0 ) T } {\displaystyle \{{\color {green}(1,0,1)^{T}},{\color {green}(0,1,0)^{T}}\}} 。
对于特征值 λ = − 1 {\displaystyle \lambda ={\color {blue}-1}} ,由于 ( A + I ) x = 0 ⟹ ( 1 0 1 0 2 0 1 0 1 ) x = 0 ⟹ x = ( c , 0 , − c ) T , {\displaystyle (A+I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}1&0&1\\0&2&0\\1&0&1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(c,0,-c)^{T},} , E − 1 {\displaystyle E_{-1}} 的一个基为 { ( 1 , 0 , − 1 ) T } {\displaystyle \{{\color {blue}(1,0,-1)^{T}}\}} .
Then, we let P = ( 1 0 1 0 1 0 1 0 − 1 ) {\displaystyle P={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}} , (since the two bases together contain three vectors) D = ( 1 0 0 0 1 0 0 0 − 1 ) {\displaystyle D={\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}} (we have two eigenvectors corresponding to the eigenvalue λ = 1 {\displaystyle \lambda =1} , so this eigenvalue is repeated two times). Then, we can compute that P − 1 = ( 1 2 0 1 2 0 1 0 1 2 0 − 1 2 ) {\displaystyle P^{-1}={\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}} . It follows that A = P D P − 1 = ( 1 0 1 0 1 0 1 0 − 1 ) ( 1 0 0 0 1 0 0 0 − 1 ) ( 1 2 0 1 2 0 1 0 1 2 0 − 1 2 ) , {\displaystyle A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}},} and A n = P D n P − 1 = ( 1 0 1 0 1 0 1 0 − 1 ) ( 1 n 0 0 0 1 n 0 0 0 ( − 1 ) n ) ( 1 2 0 1 2 0 1 0 1 2 0 − 1 2 ) = ( 1 + ( − 1 ) n 2 0 1 − ( − 1 ) n 2 0 1 0 1 − ( − 1 ) n 2 0 1 + ( − 1 ) n 2 ) = { I 3 if n is even A if n is odd . {\displaystyle A^{n}=PD^{n}P^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}^{n}&0&0\\0&{\color {green}1}^{n}&0\\0&0&({\color {blue}-1})^{n}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}={\begin{pmatrix}{\frac {1+(-1)^{n}}{2}}&0&{\frac {1-(-1)^{n}}{2}}\\0&1&0\\{\frac {1-(-1)^{n}}{2}}&0&{\frac {1+(-1)^{n}}{2}}\\\end{pmatrix}}={\begin{cases}I_{3}&{\text{if }}n{\text{ is even}}\\A&{\text{if }}n{\text{ is odd}}\end{cases}}.} This is an interesting result.
练习。
在接下来的内容中,我们将讨论对角化的一些数学应用,包括推导出序列公式以及求解 常微分方程 (ODE) 系统。
示例. (斐波那契数列) 考虑 斐波那契数列 F 0 , F 1 , … {\displaystyle F_{0},F_{1},\ldots } ,其中 F 0 = 0 {\displaystyle F_{0}=0} , F 1 = 1 {\displaystyle F_{1}=1} 以及对于每个非负整数 n {\displaystyle n} 有 F n + 2 = F n + 1 + F n {\displaystyle F_{n+2}=F_{n+1}+F_{n}} 。对于每个非负整数 n {\displaystyle n} ,这个递推关系可以描述为 ( F n + 2 F n + 1 ) = ( 1 1 1 0 ) ( F n + 1 F n ) = ( F n + 1 + F n F n ) . {\displaystyle {\begin{pmatrix}F_{n+2}\\F_{n+1}\end{pmatrix}}={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}{\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\begin{pmatrix}F_{n+1}+F_{n}\\F_{n}\end{pmatrix}}.}
令 A = ( 1 1 1 0 ) {\displaystyle A={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}} 。那么, ( F n + 1 F n ) = A ( F n F n − 1 ) = A 2 ( F n − 1 F n − 2 ) = ⋯ = A n ( F 1 F 0 ) = A n ( 1 0 ) . {\displaystyle {\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}=A{\begin{pmatrix}F_{n}\\F_{n-1}\end{pmatrix}}=A^{2}{\begin{pmatrix}F_{n-1}\\F_{n-2}\\\end{pmatrix}}=\cdots =A^{n}{\begin{pmatrix}F_{1}\\F_{0}\end{pmatrix}}=A^{n}{\begin{pmatrix}1\\0\\\end{pmatrix}}.}
为了得到 F n {\displaystyle F_{n}} 的表达式,只需要找到 A n {\displaystyle A^{n}} 的公式,我们可以通过对角化来找到它。
由于 | 1 − λ 1 1 − λ | = 0 ⟹ ( 1 − λ ) ( − λ ) − 1 = 0 ⟹ λ 2 − λ − 1 = 0 ⟹ λ = 1 + 5 2 or 1 − 5 2 . {\displaystyle {\begin{vmatrix}1-\lambda &1\\1&-\lambda \end{vmatrix}}=0\implies (1-\lambda )(-\lambda )-1=0\implies \lambda ^{2}-\lambda -1=0\implies \lambda ={\frac {1+{\sqrt {5}}}{2}}{\text{ or }}{\frac {1-{\sqrt {5}}}{2}}.} 令 φ = 1 + 5 2 {\displaystyle \varphi ={\frac {1+{\sqrt {5}}}{2}}} 为 黄金分割 , ψ = 1 − 5 2 {\displaystyle \psi ={\frac {1-{\sqrt {5}}}{2}}} 为 黄金分割 的 共轭 。
对于特征值 λ = φ {\displaystyle \lambda ={\color {green}\varphi }} ,因为对于 ( 1 − φ 1 1 − φ ) x = 0 , {\displaystyle {\begin{pmatrix}1-\varphi &1\\1&-\varphi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,我们可以将表示此线性方程组的增广矩阵转换为行最简形式如下: ( 1 − φ 1 0 1 − φ 0 ) → r 1 ↔ r 2 ( 1 − φ 0 1 − φ 1 0 ) → − ( 1 − φ ) r 1 + r 2 → r 2 ( 1 − φ 0 0 1 + φ − φ 2 0 ) = ( 1 − φ 0 0 0 0 ) . {\displaystyle {\begin{pmatrix}1-\varphi &1&0\\1&-\varphi &0\\\end{pmatrix}}{\overset {\mathbf {r} _{1}\leftrightarrow \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\1-\varphi &1&0\\\end{pmatrix}}{\overset {-(1-\varphi )\mathbf {r} _{1}+\mathbf {r} _{2}\to \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\0&1+\varphi -\varphi ^{2}&0\\\end{pmatrix}}={\begin{pmatrix}1&-\varphi &0\\0&0&0\\\end{pmatrix}}.} [ 3] 因此,通解是 x = ( a φ , a ) T {\displaystyle \mathbf {x} =(a\varphi ,a)^{T}} ,因此 E φ {\displaystyle E_{\varphi }} 的一个基是 { ( φ , 1 ) T } {\displaystyle \{{\color {green}(\varphi ,1)^{T}}\}} 。
对于特征值 λ = ψ {\displaystyle \lambda ={\color {blue}\psi }} ,因为 ( 1 − ψ 1 1 − ψ ) x = 0 , {\displaystyle {\begin{pmatrix}1-\psi &1\\1&-\psi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,表示此线性方程组的增广矩阵的行最简形式是 ( 1 − ψ 0 0 0 0 ) {\displaystyle {\begin{pmatrix}1&-\psi &0\\0&0&0\\\end{pmatrix}}} ,这是由于对称性[ 4] 。因此,通解是 x = ( b ψ , b ) T {\displaystyle \mathbf {x} =(b\psi ,b)^{T}} ,因此 E ψ {\displaystyle E_{\psi }} 的一个基是 { ( ψ , 1 ) T } {\displaystyle \{{\color {blue}(\psi ,1)^{T}}\}} 。
Then, we let P = ( φ ψ 1 1 ) {\displaystyle P={\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}} , D = ( φ 0 0 ψ ) {\displaystyle D={\begin{pmatrix}{\color {green}\varphi }&0\\0&{\color {blue}\psi }\end{pmatrix}}} . We can compute that P − 1 = 1 φ − ψ ( 1 − ψ − 1 φ ) {\displaystyle P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}} Then, A = P D P − 1 {\displaystyle A=PDP^{-1}} , and thus A n = P D n P − 1 = 1 φ − ψ ( φ ψ 1 1 ) ( φ n 0 0 ψ n ) ( 1 − ψ − 1 φ ) = 1 φ − ψ ( φ n + 1 ψ n + 1 φ n ψ n ) ( 1 − ψ − 1 φ ) = 1 φ − ψ ( φ n + 1 − ψ n + 1 − ψ φ n + 1 + φ ψ n + 1 φ n − ψ n − ψ φ n + φ ψ n ) {\displaystyle A^{n}=PD^{n}P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}{\begin{pmatrix}{\color {green}\varphi }^{n}&0\\0&{\color {blue}\psi }^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}&\psi ^{n+1}\\\varphi ^{n}&\psi ^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}} Finally, we have ( F n + 1 F n ) = 1 φ − ψ ( φ n + 1 − ψ n + 1 − ψ φ n + 1 + φ ψ n + 1 φ n − ψ n − ψ φ n + φ ψ n ) ( 1 0 ) = 1 φ − ψ ( φ n + 1 − ψ n + 1 φ n − ψ n ) . {\displaystyle {\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}{\begin{pmatrix}1\\0\\\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}\\\varphi ^{n}-\psi ^{n}\end{pmatrix}}.} Thus, F n = φ n − ψ n φ − ψ {\displaystyle F_{n}={\frac {\varphi ^{n}-\psi ^{n}}{\varphi -\psi }}} in which φ = 1 + 5 2 {\displaystyle \varphi ={\frac {1+{\sqrt {5}}}{2}}} and ψ = 1 − 5 2 {\displaystyle \psi ={\frac {1-{\sqrt {5}}}{2}}} .
示例. (常微分方程组) 考虑常微分方程组 { d x d t = 2 x − 3 y d y d t = 4 x − 5 y {\displaystyle {\begin{cases}{\frac {dx}{dt}}&=2x-3y\\{\frac {dy}{dt}}&=4x-5y\\\end{cases}}} ,初始条件为 ( x , y ) = ( 1 , 2 ) {\displaystyle (x,y)=(1,2)} ,当 t = 0 {\displaystyle t=0} 。
Using the dot notation for differentiation, the system can be rewritten as ( x ˙ y ˙ ) = A ( x y ) {\displaystyle {\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=A{\begin{pmatrix}x\\y\end{pmatrix}}} in which A = ( 2 − 3 4 − 5 ) {\displaystyle A={\begin{pmatrix}2&-3\\4&-5\\\end{pmatrix}}} . Suppose we can write A = P D P − 1 ⟺ D = P − 1 A P {\displaystyle A=PDP^{-1}\iff D=P^{-1}AP} in which P {\displaystyle P} is an invertible matrix and D {\displaystyle D} is a diagonal matrix. Let P − 1 = ( a b c d ) {\displaystyle P^{-1}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}} in which a , b , c , d {\displaystyle a,b,c,d} are some real numbers. Also, let ( u v ) = P − 1 ( x y ) = ( a b c d ) = ( a x + b y c x + d y ) {\displaystyle {\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}x\\y\\\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}={\begin{pmatrix}ax+by\\cx+dy\\\end{pmatrix}}} , which implies u = a x + b y {\displaystyle u=ax+by} and v = c x + d y {\displaystyle v=cx+dy} , and ( x y ) = P ( u v ) {\displaystyle {\begin{pmatrix}x\\y\\\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}} . It follows that u ˙ = a x ˙ + b y ˙ {\displaystyle {\dot {u}}=a{\dot {x}}+b{\dot {y}}} and v ˙ = c x ˙ + d y ˙ {\displaystyle {\dot {v}}=c{\dot {x}}+d{\dot {y}}} . Thus, ( u ˙ v ˙ ) = ( a b c d ) ( x ˙ y ˙ ) = P − 1 ( x ˙ y ˙ ) = P − 1 A ( x y ) = P − 1 A P ( u v ) = D ( u v ) . {\displaystyle {\begin{pmatrix}{\dot {u}}\\{\dot {v}}\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}A{\begin{pmatrix}x\\y\\\end{pmatrix}}=P^{-1}AP{\begin{pmatrix}u\\v\\\end{pmatrix}}=D{\begin{pmatrix}u\\v\end{pmatrix}}.} Let D = ( d 1 0 0 d 2 ) {\displaystyle D={\begin{pmatrix}d_{1}&0\\0&d_{2}\end{pmatrix}}} , then the system can be simplified to { d u d t = d 1 u d v d t = d 2 v ⟹ { 1 u d u = d 1 d t 1 v d v = d 2 d t ⟹ { ∫ 1 u d u = ∫ d 1 d t ∫ 1 v d v = ∫ d 2 d t ⟹ { ln | u | = d 1 t + C 1 ln | v | = d 2 t + C 2 ⟹ { u = ± e d 1 t + C 1 v = ± e d 2 t + C 2 ⟹ { u = C 3 e d 1 t v = C 4 e d 2 t {\displaystyle {\begin{cases}{\frac {du}{dt}}&=d_{1}u\\{\frac {dv}{dt}}&=d_{2}v\end{cases}}\implies {\begin{cases}{\frac {1}{u}}\,du&=d_{1}\,dt\\{\frac {1}{v}}\,dv&=d_{2}\,dt\end{cases}}\implies {\begin{cases}\int {\frac {1}{u}}\,du&=\int d_{1}\,dt\\\int {\frac {1}{v}}\,dv&=\int d_{2}\,dt\end{cases}}\implies {\begin{cases}\ln |u|&=d_{1}t+C_{1}\\\ln |v|&=d_{2}t+C_{2}\end{cases}}\implies {\begin{cases}u&=\pm e^{d_{1}t+C_{1}}\\v&=\pm e^{d_{2}t+C_{2}}\end{cases}}\implies {\begin{cases}u&=C_{3}e^{d_{1}t}\\v&=C_{4}e^{d_{2}t}\end{cases}}} in which C 1 , C 2 {\displaystyle C_{1},C_{2}} are arbitrary constants, and C 3 = ± e C 1 , C 4 = ± e C 2 {\displaystyle C_{3}=\pm e^{C_{1}},C_{4}=\pm e^{C_{2}}} .
然后,我们通过对角化 A {\displaystyle A} 来求解 D {\displaystyle D} : | 2 − λ − 3 4 − 5 − λ | = 0 ⟹ ( 2 − λ ) ( − 5 − λ ) + 12 = 0 ⟹ λ 2 + 3 λ + 2 = 0 ⟹ λ = − 1 or λ = − 2. {\displaystyle {\begin{vmatrix}2-\lambda &-3\\4&-5-\lambda \end{vmatrix}}=0\implies (2-\lambda )(-5-\lambda )+12=0\implies \lambda ^{2}+3\lambda +2=0\implies \lambda =-1{\text{ or }}\lambda =-2.} 对于特征值 λ = − 1 {\displaystyle \lambda =-1} , ( 3 − 3 4 − 4 ) x = 0 , {\displaystyle {\begin{pmatrix}3&-3\\4&-4\end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,其通解为 x = ( s , s ) T {\displaystyle \mathbf {x} =(s,s)^{T}} ,因此 E − 1 = { ( 1 , 1 ) T } {\displaystyle E_{-1}=\{(1,1)^{T}\}} 的一个基。
对于特征值 λ = − 2 {\displaystyle \lambda =-2} , ( 4 − 3 4 − 3 ) x = 0 , {\displaystyle {\begin{pmatrix}4&-3\\4&-3\end{pmatrix}}\mathbf {x} =\mathbf {0} ,} ,其通解为 x = ( t , 4 t / 3 ) T {\displaystyle \mathbf {x} =(t,4t/3)^{T}} ,因此 E − 2 = { ( 1 , 4 / 3 ) T } {\displaystyle E_{-2}=\{(1,4/3)^{T}\}} 的基底为。
然后,令 P = ( 1 1 1 4 3 ) {\displaystyle P={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}} 以及 D = ( − 1 0 0 − 2 ) {\displaystyle D={\begin{pmatrix}-1&0\\0&-2\end{pmatrix}}} 。由此可知, P − 1 = ( 4 − 3 − 3 3 ) {\displaystyle P^{-1}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}} 。然后, A = P D P − 1 {\displaystyle A=PDP^{-1}} 。
因此, d 1 = − 1 {\displaystyle d_{1}=-1} 和 d 2 = − 2 {\displaystyle d_{2}=-2} ,所以 u = C 3 e − t {\displaystyle u=C_{3}e^{-t}} 和 v = C 4 e − 2 t {\displaystyle v=C_{4}e^{-2t}} 。应用初始条件 ( x , y ) = ( 1 , 2 ) {\displaystyle (x,y)=(1,2)} 当 t = 0 {\displaystyle t=0} 时, ( u v ) = P − 1 ( 1 2 ) = ( 4 − 3 − 3 3 ) ( 1 3 ) = ( − 2 3 ) {\displaystyle {\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}1\\2\\\end{pmatrix}}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}{\begin{pmatrix}1\\3\\\end{pmatrix}}={\begin{pmatrix}-2\\3\end{pmatrix}}} 当 t = 0 {\displaystyle t=0} 时,这意味着 u = − 2 e − t {\displaystyle u=-2e^{-t}} 和 v = 3 e − 2 t {\displaystyle v=3e^{-2t}} 。因此, ( x y ) = P ( u v ) = ( 1 1 1 4 3 ) ( − 2 e − t 3 e − 2 t ) = ( 3 e − 2 t − 2 e − t 4 e − 2 t − 2 e − t ) . {\displaystyle {\begin{pmatrix}x\\y\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}{\begin{pmatrix}-2e^{-t}\\3e^{-2t}\end{pmatrix}}={\begin{pmatrix}3e^{-2t}-2e^{-t}\\4e^{-2t}-2e^{-t}\end{pmatrix}}.} 因此,此微分方程组的解为 ( x , y ) = ( 3 e − 2 t − 2 e − t , 4 e − 2 t − 2 e − t ) . {\displaystyle (x,y)=(3e^{-2t}-2e^{-t},4e^{-2t}-2e^{-t}).}
练习。
↑ 但即使 A {\displaystyle A} 具有严格少于 n {\displaystyle n} 个特征值, A {\displaystyle A} 仍然可以是对角化的。实际上, A {\displaystyle A} 最多有 n {\displaystyle n} 个不同的特征值,因为 λ {\displaystyle \lambda } 的特征多项式是 λ {\displaystyle \lambda } 的 n {\displaystyle n} 次多项式,根据代数基本定理,它有 n {\displaystyle n} 个根(其中一些可能重复)。
↑ 它是复数 1 + 2 i {\displaystyle 1+2i} 的矩阵表示形式。
↑ 1 + φ − φ 2 = 0 {\displaystyle 1+\varphi -\varphi ^{2}=0} 因为 1 + φ − φ = − ( φ 2 − φ − 1 ⏟ 0 ) = 0 {\displaystyle 1+\varphi -\varphi =-(\underbrace {\varphi ^{2}-\varphi -1} _{0})=0}
↑ 特别地, 1 + φ − φ 2 = 1 + ψ − ψ 2 = 0. {\displaystyle 1+\varphi -\varphi ^{2}=1+\psi -\psi ^{2}=0.} ,因为 φ , ψ {\displaystyle \varphi ,\psi } 都满足方程 λ 2 − λ − 1 = 0 {\displaystyle \lambda ^{2}-\lambda -1=0} .