线性代数入门/特征值和特征向量

线性代数入门
特征值和特征向量

动机

在讨论特征值、特征向量和对角化之前，我们先提供一些动机。

示例。 (对角矩阵的幂公式) 令 $D={\begin{pmatrix}3&0\\0&-5\end{pmatrix}}$ . 那么， $D={\begin{pmatrix}3^{n}&0\\0&(-5)^{n}\end{pmatrix}}$ 对于每个正整数 $n$ ，因为 ${\begin{pmatrix}3&0\\0&-5\end{pmatrix}}{\begin{pmatrix}3^{k}&0\\0&(-5)^{k}\end{pmatrix}}={\begin{pmatrix}3^{k+1}&0\\0&(-5)^{k+1}\end{pmatrix}},$ 我们可以通过归纳法证明对角矩阵的幂公式。

示例. 令 $P={\begin{pmatrix}1&1\\2&3\\\end{pmatrix}}$ 和 $D={\begin{pmatrix}3&0\\0&-5\end{pmatrix}}$ . 那么，可以计算出 $P^{-1}={\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}$ . 令 $A=PDP^{-1}={\begin{pmatrix}19&-8\\48&-21\\\end{pmatrix}}$ . 那么， ${\begin{aligned}A^{n}&=(PDP^{-1})^{n}=\underbrace {(PD{\color {blue}P^{-1}})({\color {blue}P}DP^{-1})\cdots (PD{\color {brown}P^{-1}})({\color {brown}P}DP^{-1})} _{n\;PDP^{-1}{\text{'s}}}\\&=PD(\underbrace {\color {blue}P^{-1}P} _{\color {blue}I})DP^{-1}\cdots PD(\underbrace {\color {brown}P^{-1}P} _{\color {brown}I})DP^{-1}\\&=PD\underbrace {{\color {blue}I}D\cdots {\color {brown}I}D} _{n-1\;ID{\text{'s}}}P^{-1}\\&=P\underbrace {DD\cdots D} _{n\;D{\text{'s}}}P^{-1}\\&=PD^{n}P^{-1}\\&=P{\begin{pmatrix}3^{n}&0\\0&(-5)^{n}\end{pmatrix}}P^{-1}\qquad {\text{by above example}}\\&={\begin{pmatrix}1&1\\2&3\\\end{pmatrix}}{\begin{pmatrix}3^{n}&0\\0&(-5)^{n}\end{pmatrix}}{\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}\\&={\begin{pmatrix}3^{n+1}-2(-5)^{n}&(-5)^{n}-3^{n}\\6(3^{n})-6(-5)^{n}&3(-5)^{n}-2(3^{n})\\\end{pmatrix}}\end{aligned}}$

从这个例子可以看出，对于一些特殊的矩阵，它们的幂可以通过以下形式方便地计算出来： $PDP^{-1}$ ，其中 $P$ 是可逆矩阵， $D$ 是对角矩阵。

当然，给定一个矩阵，我们会想知道它是否可以表示为 $PDP^{-1}$ 的形式，如果可以， $P$ 和 $D$ 是什么，以便我们可以方便地计算它的幂。这是本章的主要目标。

特征值，特征向量和对角化

鉴于动机部分，我们有以下定义。

定义。 (可对角化矩阵) 方阵 $A$ 是 可对角化 的，如果存在一个可逆矩阵 $P$ ，使得 $P^{-1}AP$ 是对角矩阵。

备注。 等价的条件是 $A=PDP^{-1}$ 对于一些对角矩阵 $D$ 和可逆矩阵 $P$ ，这与动机部分的形式相匹配。因此，如果一个矩阵是 可对角化 的，我们可以方便地计算它的幂。

示例。 矩阵 $I_{n}$ 是 可对角化 的，因为存在 $P=I_{n}$ ，使得 $P^{-1}I_{n}P$ 是对角矩阵（即 $I_{n}$ ）。此外，存在 $P=I_{n},D=I_{n}$ ，使得 $I_{n}=PDP^{-1}$ 。

练习。

以下是与对角化在某种程度上相关的重要的通用概念。

定义。（特征向量和特征值）设 $A$ 为方阵。如果存在一个标量 $\lambda$ 使得 $A\mathbf {v} =\lambda \mathbf {v}$ ，则一个非零向量 $\mathbf {v}$ 是 $A$ 的一个 特征向量，则 $\lambda$ 是 $A$ 对应于 特征向量 $\mathbf {v}$ 的一个 特征值。

备注。

$A\mathbf {v} =\lambda \mathbf {v}$ 表示将向量 $\mathbf {v}$ 乘以矩阵 $A$ 等价于将其乘以一个标量（向量的缩放）。
前缀 eigen- 的意思是“自己的”、“适当的”和“特征的”。

示例。（单位矩阵的特征向量）每个向量 $\mathbf {v} \in \mathbb {R} ^{n}$ 是 $I_{n}$ 的一个特征向量，因为 $I_{n}\mathbf {v} =\mathbf {v} =1\cdot \mathbf {v} ,$ 对于每个向量 $\mathbf {v} \in \mathbb {R} ^{n}$ ，它们的对应特征值都是 $1$ 。

练习。

	如果 $\mathbf {v}$ 是可逆矩阵 $A$ 的一个特征向量，那么它也是 $A^{-1}$ 的一个特征向量。
	如果 $\lambda$ 是 $A$ 的一个特征值，那么 $\lambda ^{n}$ 是 $A^{n}$ 的一个特征值。
	每个向量 $\mathbf {v} \in \mathbb {R} ^{n}$ 都是零矩阵 $O_{n\times n}$ 的特征向量。
	零向量是每个方阵的特征向量。
	如果一个矩阵存在特征向量，那么这个矩阵就有无穷多个特征向量。

以下定理将可对角化矩阵与特征向量和特征值联系起来。

定理。 (对角化) 设 $A$ 是一个 $n\times n$ 矩阵。那么， $A$ 是 可对角化 的当且仅当 $A$ 具有 $n$ 个 线性无关特征向量。如果 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 是 $A$ 的 线性无关特征向量，对应于 特征值 $\lambda _{1},\ldots ,\lambda _{n}$ （其中一些可能是相同的），我们可以定义一个可逆矩阵 $P$ ，其列为 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ ，以及一个对角矩阵 $D$ ，其 对角元素 为 $\lambda _{1},\ldots ,\lambda _{n}$ ，使得 $A=PDP^{-1}.$

证明。 以下我们使用 ${\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}$ 来表示以 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 为列向量，按此顺序排列的矩阵。 ${\begin{aligned}&&A&=PDP^{-1}\\&\Leftrightarrow &AP&=PD\underbrace {PP^{-1}} _{I}\\&\Leftrightarrow &A{\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}{\begin{pmatrix}\lambda _{1}&0&\cdots &0\\0&\lambda _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\lambda _{n}\end{pmatrix}}\\&\Leftrightarrow &{\begin{pmatrix}A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\end{pmatrix}}&={\begin{pmatrix}\lambda _{1}\mathbf {v} _{1}&\cdots &\lambda _{n}\mathbf {v} _{n}\end{pmatrix}}\\&\Leftrightarrow &A\mathbf {v} _{1}&=\lambda _{1}\mathbf {v} _{1},\ldots ,A\mathbf {v} _{n}=\lambda _{n}\mathbf {v} _{n}.\end{aligned}}$ 我们现在已经证明了 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 是 特征向量。现在剩下要证明的是它们是 线性无关 的，这可以通过以下论据证明：它们是 线性无关 当且仅当 $P$ 可逆，根据可逆性与线性无关的关系命题可知。 $\Box$

备注。

我们可以将特征向量放入 $P$ 作为列向量，以任意顺序，只要我们将特征值放入 $D$ 的对应列中，例如，我们可以将 $\mathbf {v} _{1}$ 放入 $P$ 的第 3 列，但我们需要将 $\lambda _{1}$ 放入 $D$ 的第 3 列。

由此可知，对角化的表达式 并不唯一，实际上有无限多个表达式。

根据矩阵乘法的定义，我们有 $A{\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}={\begin{pmatrix}A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\end{pmatrix}},$ 例如， $A{\begin{pmatrix}\mathbf {u} &\mathbf {w} \end{pmatrix}}:={\begin{pmatrix}1&2\\3&4\\\end{pmatrix}}{\begin{pmatrix}u_{1}&w_{1}\\u_{2}&w_{2}\end{pmatrix}}={\begin{pmatrix}u_{1}+2u_{2}&w_{1}+2w_{2}\\3u_{1}+4u_{2}&3w_{1}+4w_{2}\\\end{pmatrix}},A\mathbf {u} ={\begin{pmatrix}u_{1}+2u_{2}\\3u_{1}+4u_{2}\\\end{pmatrix}},A\mathbf {w} ={\begin{pmatrix}w_{1}+2w_{2}\\3w_{1}+4w_{2}\\\end{pmatrix}}$

接下来，我们将介绍一种方便的方法来找到 特征值。在此之前，我们先介绍一个与这种寻找特征值的方法相关的术语。

定义. （特征多项式）设 $A$ 为 $n\times n$ 矩阵。 $A$ 关于变量 $t$ 的 特征多项式 是多项式 $\det(A-tI_{n})$ 。

备注。

我们可以使用任意字母来表示变量。
等价地，特征多项式 of $A$ 是 $A$ 的行列式，其对角线元素减去 $t$ .

示例. ${\begin{pmatrix}1&2&4\\4&5&2\\0&0&9\\\end{pmatrix}}$ 的特征多项式是 ${\begin{vmatrix}1-t&2&4\\4&5-t&2\\0&0&9-t\\\end{vmatrix}}=(9-t){\begin{vmatrix}1-t&2\\4&5-t\\\end{vmatrix}}=(9-t)[(1-t)(5-t)-2(4)]=-x^{3}+15x^{2}-51x-27.$ .

命题. (特征值等价条件) 设 $A$ 是一个 $n\times n$ 矩阵。则， $\lambda$ 是 $A$ 的特征值 当且仅当 $\det(A-\lambda I_{n})=0$ ，即它是 $A$ 的特征多项式 的根。

证明. ${\begin{aligned}&&\lambda {\text{ is an }}&{\text{eigenvalue of }}A\\&\Leftrightarrow &A\mathbf {v} &=\lambda \mathbf {v} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &(A-\lambda I_{n})\mathbf {v} &=\mathbf {0} \qquad {\text{for some }}\mathbf {v} \neq \mathbf {0} \\&\Leftrightarrow &A-\lambda I_{n}&{\text{ is non-invertible}}\qquad {\text{by simplified invertible matrix theorem}}\\&\Leftrightarrow &\det(A-\lambda I_{n})&=0\end{aligned}}$ .

$\Box$

接下来，我们将介绍一个与特征向量相关的概念。

练习。

	一个方阵有 $n$ 个不同的特征值，如果其特征多项式有 $n$ 个根。
	如果大小为 $2\times 2$ 的矩阵 $A$ 有两个线性无关的特征向量 $(3,1)^{T},(0,2)^{T}$ ，分别对应特征值 $4,5$ ，那么我们可以定义一个可逆矩阵 $P={\begin{pmatrix}3&1\\0&2\\\end{pmatrix}}$ 和一个对角矩阵 $D={\begin{pmatrix}4&0\\0&5\end{pmatrix}}$ ，使得 $A=P^{-1}DP$ 。
	如果大小为 $2\times 2$ 的矩阵 $A$ 有两个线性无关的特征向量，那么我们可以定义一个可逆矩阵 $P$ 和一个对角矩阵 $D$ ，使得 $A=P^{-1}DP$ 。

定义。 （特征空间）令 $A$ 为一个 $n\times n$ 矩阵。假设 $\lambda$ 是 $A$ 的一个 特征值。那么， $\operatorname {Null} (A-\lambda I_{n})$ ，记作 $E_{\lambda }$ ，是 $A$ 对应于 $\lambda$ 的 特征空间。

备注。

由于零空间是 $\mathbb {R} ^{n}$ 的子空间，因此 特征空间 也是 $\mathbb {R} ^{n}$ 的子空间。
$E_{\lambda }$ 由零向量（因为它是一个子空间）和所有对应于 $\lambda$ 的 特征向量 组成，因为

$A\mathbf {v} =\lambda \mathbf {v} \iff (A-\lambda I_{n})\mathbf {v} =\mathbf {0} \iff \mathbf {v} \in \operatorname {Null} (A-\lambda I_{n})=E_{\lambda }\quad (\mathbf {v} \neq \mathbf {0} {\text{ by definition}})$

在介绍了这些术语和概念之后，我们有以下用于对 $n\times n$ 矩阵进行对角化的算法步骤

通过求解 $\det(A-\lambda I)=0$ 计算 $A$ 的所有 特征值
对于矩阵 $A$ 的每个特征值 $\lambda _{1},\ldots ,\lambda _{k}$ ，找到对应 特征空间 $E_{\lambda _{1}},\ldots ,E_{\lambda _{k}}$ 的基 $\beta _{1},\ldots ,\beta _{k}$ 。
如果 $\beta _{1},\ldots ,\beta _{k}$ 包含 $n$ 个向量 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ （如果没有，则 $A$ 不可对角化），定义 $P={\begin{pmatrix}\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\end{pmatrix}}$
我们有 $A=PDP^{-1}$ ，其中 $D$ 是一个对角矩阵，其对角元素是对应于 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ 的 特征值。

备注。

可以证明，对应于 不同特征值 的 $A$ 的 特征向量 是 线性无关 的（证明过程在此省略）。

因此， $P$ 的列向量线性无关，所以 $P$ 是可逆的。

如果 $A$ 有 $n$ 个 不同的特征值，那么 $A$ 是可对角化的^[1]，因为有 $n$ 个基对应于 $n$ 个 特征值，它们共同包含 $n$ 个向量 $\mathbf {v} _{1},\ldots ,\mathbf {v} _{n}$ .
每个特征值有无限多个可能的基，但我们只需要其中一个。

例子。 （ $2\times 2$ 矩阵的对角化）回忆一下动机部分的例子，给定矩阵 $A={\begin{pmatrix}19&-8\\48&-21\\\end{pmatrix}}$ 是可对角化的，并且它的 $PDP^{-1}$ 形式的表达式也被给出。我们将使用上述过程来推导出给定的表达式。

首先， ${\begin{vmatrix}19-\lambda &-8\\48&-21-\lambda \end{vmatrix}}=0\iff (19-\lambda )(-21-\lambda )+8(48)=0\implies \lambda ^{2}+2\lambda -15=0\iff \lambda =3{\text{ or }}\lambda =-5.$ 所以，矩阵的特征值为 $\lambda =3$ 和 $\lambda =-5$ .

对于特征值 $\lambda ={\color {green}3}$ ，因为 $(A-3I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}16&-8\\48&-24\\\end{pmatrix}}\mathbf {x} =\mathbf {0}$ ，并且可以证明其通解为 $\mathbf {x} =(a,2a)^{T}$ ，因此 $E_{3}$ 的基为 $\{{\color {green}(1,2)^{T}}\}$

对于特征值 $\lambda ={\color {blue}-5}$ ，因为 $(A+5I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}24&-8\\48&-16\\\end{pmatrix}}\mathbf {x} =\mathbf {0}$ ，并且可以证明其通解为 $\mathbf {x} =(b,3b)^{T}$ ，因此 $E_{-5}$ 的基为 $\{{\color {blue}(1,3)^{T}}\}$

然后，我们令 $P={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}$ （因为两个基底加起来包含两个向量），并且 $D={\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}.$ 然后，我们可以计算得到 $P^{-1}={\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}}.$ 因此，我们有 $A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {blue}1}\\{\color {green}2}&{\color {blue}3}\\\end{pmatrix}}{\begin{pmatrix}{\color {green}3}&0\\0&{\color {blue}-5}\end{pmatrix}}{\begin{pmatrix}3&-1\\-2&1\\\end{pmatrix}},$ 这与动机部分示例中给出的形式相同。一般来说，如果我们有 $A=PDP^{-1}$ ， $A^{n}=PD^{n}P^{-1},$ 这在动机部分的示例中有所说明。从动机部分的示例来看， $A^{n}={\begin{pmatrix}3^{n+1}-2(-5)^{n}&(-5)^{n}-3^{n}\\6(3^{n})-6(-5)^{n}&3(-5)^{n}-2(3^{n})\\\end{pmatrix}}.$

示例：（ $3\times 3$ 矩阵的对角化）考虑矩阵 $A={\begin{pmatrix}0&0&1\\0&1&0\\1&0&0\\\end{pmatrix}}$ （它不是 $I_{3}$ ）。我们希望找到一个关于 $A^{n}$ 的公式。首先， ${\begin{vmatrix}-\lambda &0&1\\0&1-\lambda &0\\1&0&-\lambda \end{vmatrix}}=0\implies \lambda ^{2}(1-\lambda )-(1-\lambda )=0\implies (1-\lambda )(\lambda ^{2}-1)=0\implies \lambda =1{\text{(repeated) or }}\lambda =-1.$ 因此，矩阵的特征值为 $\lambda =1$ 和 $\lambda =-1$ 。

对于特征值 $\lambda ={\color {green}1}$ ，由于 $(A-I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}-1&0&1\\0&0&0\\1&0&-1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(b,a,b)^{T}=b(1,0,1)^{T}+a(0,1,0)^{T},$ （有两个独立的未知数，所以每个特征空间的基的维数是 $2$ ，即每个基应该有两个向量）， $E_{1}$ 的一个基是 $\{{\color {green}(1,0,1)^{T}},{\color {green}(0,1,0)^{T}}\}$ 。

对于特征值 $\lambda ={\color {blue}-1}$ ，由于 $(A+I)\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}1&0&1\\0&2&0\\1&0&1\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(c,0,-c)^{T},$ ， $E_{-1}$ 的一个基为 $\{{\color {blue}(1,0,-1)^{T}}\}$ .

Then, we let $P={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}$ , (since the two bases together contain three vectors) $D={\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}$ (we have two eigenvectors corresponding to the eigenvalue $\lambda =1$ , so this eigenvalue is repeated two times). Then, we can compute that $P^{-1}={\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}$ . It follows that $A=PDP^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}&0&0\\0&{\color {green}1}&0\\0&0&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}},$ and $A^{n}=PD^{n}P^{-1}={\begin{pmatrix}{\color {green}1}&{\color {green}0}&{\color {blue}1}\\{\color {green}0}&{\color {green}1}&{\color {blue}0}\\{\color {green}1}&{\color {green}0}&{\color {blue}-1}\end{pmatrix}}{\begin{pmatrix}{\color {green}1}^{n}&0&0\\0&{\color {green}1}^{n}&0\\0&0&({\color {blue}-1})^{n}\end{pmatrix}}{\begin{pmatrix}{\frac {1}{2}}&0&{\frac {1}{2}}\\0&1&0\\{\frac {1}{2}}&0&-{\frac {1}{2}}\end{pmatrix}}={\begin{pmatrix}{\frac {1+(-1)^{n}}{2}}&0&{\frac {1-(-1)^{n}}{2}}\\0&1&0\\{\frac {1-(-1)^{n}}{2}}&0&{\frac {1+(-1)^{n}}{2}}\\\end{pmatrix}}={\begin{cases}I_{3}&{\text{if }}n{\text{ is even}}\\A&{\text{if }}n{\text{ is odd}}\end{cases}}.$ This is an interesting result.

例：（复特征值）令 $A={\begin{pmatrix}1&2\\-2&1\\\end{pmatrix}}.$ ^[2] ${\begin{vmatrix}1-\lambda &2\\-2&1-\lambda \end{vmatrix}}=0\implies (1-\lambda )^{2}+4=0\implies (1-\lambda )^{2}=-4\implies 1-\lambda =\pm 2i\implies \lambda =1\mp 2i.$ 由于特征值都是复数（因此不存在相应的实特征向量）， $A$ 是不可对角化的 在实矩阵上。另一方面， $A$ 是在复矩阵上可以对角化的，但我们在本书中不关注复矩阵上的对角化，并且我们没有定义复矩阵的运算。因此， $A$ 用 $PDP^{-1}$ 的形式表示如下，仅供参考： $A={\begin{pmatrix}i&-i\\1&1\\\end{pmatrix}}{\begin{pmatrix}1-2i&0\\0&1+2i\end{pmatrix}}{\begin{pmatrix}i&-i\\1&1\end{pmatrix}}^{-1}.$

例。（不可对角化矩阵）考虑矩阵 $N={\begin{pmatrix}0&1\\0&0\\\end{pmatrix}}$ （它是一个 幂零矩阵，满足 $N^{2}=O$ ）。

首先，由于 ${\begin{vmatrix}-\lambda &1\\0&-\lambda \end{vmatrix}}=0\implies \lambda ^{2}=0\implies \lambda =0,$ 唯一的特征值为 $\lambda =0$ .

对于特征值 $\lambda =0$ ，由于 $(N+0I)\mathbf {x} =\mathbf {0} \implies N\mathbf {x} =\mathbf {0} \implies {\begin{pmatrix}0&1\\0&0\\\end{pmatrix}}\mathbf {x} =\mathbf {0} \implies \mathbf {x} =(a,0)^{T}$ 所以， $E_{0}$ 的一个基是 $\{(1,0)^{T}\}$ 。由于它只包含一个向量，而矩阵的大小为 $2\times 2$ ， $N$ 是 不可对角化的。

练习。

	${\begin{pmatrix}1024&0\\0&59049\\\end{pmatrix}}$ .
	${\begin{pmatrix}7776&0\\0&7776\end{pmatrix}}$ .
	${\begin{pmatrix}7777&0\\0&7777\end{pmatrix}}$ .
	${\begin{pmatrix}59049&0\\0&1024\\\end{pmatrix}}$ .

	在实矩阵上，特征空间可以是零空间，即仅包含零向量。
	特征空间必须包含无限多个特征向量。
	特征空间的每个基都包含线性无关的向量。
	假设通过对角化，矩阵 $A$ 可以表示为 $A=PDP^{-1}$ ，其中 $P$ 是一个可逆矩阵，而 $D$ 是一个对角矩阵，那么，对于每个正整数 $n$ ， $P^{-1}A^{n}P$ 是一个对角矩阵。

在接下来的内容中，我们将讨论对角化的一些数学应用，包括推导出序列公式以及求解 常微分方程 (ODE) 系统。

示例. (斐波那契数列) 考虑 斐波那契数列 $F_{0},F_{1},\ldots$ ，其中 $F_{0}=0$ ， $F_{1}=1$ 以及对于每个非负整数 $n$ 有 $F_{n+2}=F_{n+1}+F_{n}$ 。对于每个非负整数 $n$ ，这个递推关系可以描述为 ${\begin{pmatrix}F_{n+2}\\F_{n+1}\end{pmatrix}}={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}{\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\begin{pmatrix}F_{n+1}+F_{n}\\F_{n}\end{pmatrix}}.$

令 $A={\begin{pmatrix}1&1\\1&0\\\end{pmatrix}}$ 。那么， ${\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}=A{\begin{pmatrix}F_{n}\\F_{n-1}\end{pmatrix}}=A^{2}{\begin{pmatrix}F_{n-1}\\F_{n-2}\\\end{pmatrix}}=\cdots =A^{n}{\begin{pmatrix}F_{1}\\F_{0}\end{pmatrix}}=A^{n}{\begin{pmatrix}1\\0\\\end{pmatrix}}.$

为了得到 $F_{n}$ 的表达式，只需要找到 $A^{n}$ 的公式，我们可以通过对角化来找到它。

由于 ${\begin{vmatrix}1-\lambda &1\\1&-\lambda \end{vmatrix}}=0\implies (1-\lambda )(-\lambda )-1=0\implies \lambda ^{2}-\lambda -1=0\implies \lambda ={\frac {1+{\sqrt {5}}}{2}}{\text{ or }}{\frac {1-{\sqrt {5}}}{2}}.$ 令 $\varphi ={\frac {1+{\sqrt {5}}}{2}}$ 为 黄金分割， $\psi ={\frac {1-{\sqrt {5}}}{2}}$ 为 黄金分割 的共轭。

对于特征值 $\lambda ={\color {green}\varphi }$ ，因为对于 ${\begin{pmatrix}1-\varphi &1\\1&-\varphi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，我们可以将表示此线性方程组的增广矩阵转换为行最简形式如下： ${\begin{pmatrix}1-\varphi &1&0\\1&-\varphi &0\\\end{pmatrix}}{\overset {\mathbf {r} _{1}\leftrightarrow \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\1-\varphi &1&0\\\end{pmatrix}}{\overset {-(1-\varphi )\mathbf {r} _{1}+\mathbf {r} _{2}\to \mathbf {r} _{2}}{\to }}{\begin{pmatrix}1&-\varphi &0\\0&1+\varphi -\varphi ^{2}&0\\\end{pmatrix}}={\begin{pmatrix}1&-\varphi &0\\0&0&0\\\end{pmatrix}}.$ ^[3] 因此，通解是 $\mathbf {x} =(a\varphi ,a)^{T}$ ，因此 $E_{\varphi }$ 的一个基是 $\{{\color {green}(\varphi ,1)^{T}}\}$ 。

对于特征值 $\lambda ={\color {blue}\psi }$ ，因为 ${\begin{pmatrix}1-\psi &1\\1&-\psi \end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，表示此线性方程组的增广矩阵的行最简形式是 ${\begin{pmatrix}1&-\psi &0\\0&0&0\\\end{pmatrix}}$ ，这是由于对称性^[4]。因此，通解是 $\mathbf {x} =(b\psi ,b)^{T}$ ，因此 $E_{\psi }$ 的一个基是 $\{{\color {blue}(\psi ,1)^{T}}\}$ 。

Then, we let $P={\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}$ , $D={\begin{pmatrix}{\color {green}\varphi }&0\\0&{\color {blue}\psi }\end{pmatrix}}$ . We can compute that $P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}$ Then, $A=PDP^{-1}$ , and thus $A^{n}=PD^{n}P^{-1}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}{\color {green}\varphi }&{\color {blue}\psi }\\{\color {green}1}&{\color {blue}1}\end{pmatrix}}{\begin{pmatrix}{\color {green}\varphi }^{n}&0\\0&{\color {blue}\psi }^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}&\psi ^{n+1}\\\varphi ^{n}&\psi ^{n}\end{pmatrix}}{\begin{pmatrix}1&-\psi \\-1&\varphi \end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}$ Finally, we have ${\begin{pmatrix}F_{n+1}\\F_{n}\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}&-\psi \varphi ^{n+1}+\varphi \psi ^{n+1}\\\varphi ^{n}-\psi ^{n}&-\psi \varphi ^{n}+\varphi \psi ^{n}\end{pmatrix}}{\begin{pmatrix}1\\0\\\end{pmatrix}}={\frac {1}{\varphi -\psi }}{\begin{pmatrix}\varphi ^{n+1}-\psi ^{n+1}\\\varphi ^{n}-\psi ^{n}\end{pmatrix}}.$ Thus, $F_{n}={\frac {\varphi ^{n}-\psi ^{n}}{\varphi -\psi }}$ in which $\varphi ={\frac {1+{\sqrt {5}}}{2}}$ and $\psi ={\frac {1-{\sqrt {5}}}{2}}$ .

练习。 定义一个数列 $a_{0},a_{1},\ldots$ ，其中 $a_{0}=1$ 且对于每个非负整数 $n$ ， $a_{n+1}=2a_{n}$ 成立。

	$a_{n}=2^{n-1}$ .
	$a_{n}=8a_{n-2}$ .
	$a_{n}=32a_{n-5}$ .
	$a_{n}=128a_{n-6}$ .

	$b_{n}=2^{n}+1$ .
	$b_{n}=3-2^{n}$ .
	$b_{n}=2^{n}$ .
	$b_{n}=2b_{n-1}$ .
	$b_{n}=b_{n-1}+2$ .

示例. (常微分方程组) 考虑常微分方程组 ${\begin{cases}{\frac {dx}{dt}}&=2x-3y\\{\frac {dy}{dt}}&=4x-5y\\\end{cases}}$ ，初始条件为 $(x,y)=(1,2)$ ，当 $t=0$ 。

Using the dot notation for differentiation, the system can be rewritten as ${\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=A{\begin{pmatrix}x\\y\end{pmatrix}}$ in which $A={\begin{pmatrix}2&-3\\4&-5\\\end{pmatrix}}$ . Suppose we can write $A=PDP^{-1}\iff D=P^{-1}AP$ in which $P$ is an invertible matrix and $D$ is a diagonal matrix. Let $P^{-1}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}$ in which $a,b,c,d$ are some real numbers. Also, let ${\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}x\\y\\\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}={\begin{pmatrix}ax+by\\cx+dy\\\end{pmatrix}}$ , which implies $u=ax+by$ and $v=cx+dy$ , and ${\begin{pmatrix}x\\y\\\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}$ . It follows that ${\dot {u}}=a{\dot {x}}+b{\dot {y}}$ and ${\dot {v}}=c{\dot {x}}+d{\dot {y}}$ . Thus, ${\begin{pmatrix}{\dot {u}}\\{\dot {v}}\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\\\end{pmatrix}}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}{\begin{pmatrix}{\dot {x}}\\{\dot {y}}\end{pmatrix}}=P^{-1}A{\begin{pmatrix}x\\y\\\end{pmatrix}}=P^{-1}AP{\begin{pmatrix}u\\v\\\end{pmatrix}}=D{\begin{pmatrix}u\\v\end{pmatrix}}.$ Let $D={\begin{pmatrix}d_{1}&0\\0&d_{2}\end{pmatrix}}$ , then the system can be simplified to ${\begin{cases}{\frac {du}{dt}}&=d_{1}u\\{\frac {dv}{dt}}&=d_{2}v\end{cases}}\implies {\begin{cases}{\frac {1}{u}}\,du&=d_{1}\,dt\\{\frac {1}{v}}\,dv&=d_{2}\,dt\end{cases}}\implies {\begin{cases}\int {\frac {1}{u}}\,du&=\int d_{1}\,dt\\\int {\frac {1}{v}}\,dv&=\int d_{2}\,dt\end{cases}}\implies {\begin{cases}\ln |u|&=d_{1}t+C_{1}\\\ln |v|&=d_{2}t+C_{2}\end{cases}}\implies {\begin{cases}u&=\pm e^{d_{1}t+C_{1}}\\v&=\pm e^{d_{2}t+C_{2}}\end{cases}}\implies {\begin{cases}u&=C_{3}e^{d_{1}t}\\v&=C_{4}e^{d_{2}t}\end{cases}}$ in which $C_{1},C_{2}$ are arbitrary constants, and $C_{3}=\pm e^{C_{1}},C_{4}=\pm e^{C_{2}}$ .

然后，我们通过对角化 $A$ 来求解 $D$ ： ${\begin{vmatrix}2-\lambda &-3\\4&-5-\lambda \end{vmatrix}}=0\implies (2-\lambda )(-5-\lambda )+12=0\implies \lambda ^{2}+3\lambda +2=0\implies \lambda =-1{\text{ or }}\lambda =-2.$ 对于特征值 $\lambda =-1$ ， ${\begin{pmatrix}3&-3\\4&-4\end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，其通解为 $\mathbf {x} =(s,s)^{T}$ ，因此 $E_{-1}=\{(1,1)^{T}\}$ 的一个基。

对于特征值 $\lambda =-2$ ， ${\begin{pmatrix}4&-3\\4&-3\end{pmatrix}}\mathbf {x} =\mathbf {0} ,$ ，其通解为 $\mathbf {x} =(t,4t/3)^{T}$ ，因此 $E_{-2}=\{(1,4/3)^{T}\}$ 的基底为。

然后，令 $P={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}$ 以及 $D={\begin{pmatrix}-1&0\\0&-2\end{pmatrix}}$ 。由此可知， $P^{-1}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}$ 。然后， $A=PDP^{-1}$ 。

因此， $d_{1}=-1$ 和 $d_{2}=-2$ ，所以 $u=C_{3}e^{-t}$ 和 $v=C_{4}e^{-2t}$ 。应用初始条件 $(x,y)=(1,2)$ 当 $t=0$ 时， ${\begin{pmatrix}u\\v\\\end{pmatrix}}=P^{-1}{\begin{pmatrix}1\\2\\\end{pmatrix}}={\begin{pmatrix}4&-3\\-3&3\end{pmatrix}}{\begin{pmatrix}1\\3\\\end{pmatrix}}={\begin{pmatrix}-2\\3\end{pmatrix}}$ 当 $t=0$ 时，这意味着 $u=-2e^{-t}$ 和 $v=3e^{-2t}$ 。因此， ${\begin{pmatrix}x\\y\end{pmatrix}}=P{\begin{pmatrix}u\\v\end{pmatrix}}={\begin{pmatrix}1&1\\1&{\frac {4}{3}}\end{pmatrix}}{\begin{pmatrix}-2e^{-t}\\3e^{-2t}\end{pmatrix}}={\begin{pmatrix}3e^{-2t}-2e^{-t}\\4e^{-2t}-2e^{-t}\end{pmatrix}}.$ 因此，此微分方程组的解为 $(x,y)=(3e^{-2t}-2e^{-t},4e^{-2t}-2e^{-t}).$

练习。

向量和子空间

线性代数入门
特征值和特征向量

↑ 但即使 $A$ 具有严格少于 $n$ 个特征值， $A$ 仍然可以是对角化的。实际上， $A$ 最多有 $n$ 个不同的特征值，因为 $\lambda$ 的特征多项式是 $\lambda$ 的 $n$ 次多项式，根据代数基本定理，它有 $n$ 个根（其中一些可能重复）。
↑ 它是复数 $1+2i$ 的矩阵表示形式。
↑ $1+\varphi -\varphi ^{2}=0$ 因为 $1+\varphi -\varphi =-(\underbrace {\varphi ^{2}-\varphi -1} _{0})=0$
↑ 特别地， $1+\varphi -\varphi ^{2}=1+\psi -\psi ^{2}=0.$ ，因为 $\varphi ,\psi$ 都满足方程 $\lambda ^{2}-\lambda -1=0$ .

[1] 但即使 $A$ 具有严格少于 $n$ 个特征值， $A$ 仍然可以是对角化的。实际上， $A$ 最多有 $n$ 个不同的特征值，因为 $\lambda$ 的特征多项式是 $\lambda$ 的 $n$ 次多项式，根据代数基本定理，它有 $n$ 个根（其中一些可能重复）。

[2] 它是复数 $1+2i$ 的矩阵表示形式。

[3] $1+\varphi -\varphi ^{2}=0$ 因为 $1+\varphi -\varphi =-(\underbrace {\varphi ^{2}-\varphi -1} _{0})=0$

[4] 特别地， $1+\varphi -\varphi ^{2}=1+\psi -\psi ^{2}=0.$ ，因为 $\varphi ,\psi$ 都满足方程 $\lambda ^{2}-\lambda -1=0$ .

[1]

[2]

[3]

[4]

	$(x,y)=(2e^{2t},3e^{6t})$ .
	$(x,y)=(2e^{2t}+3e^{6t},3e^{2t}+2e^{6t})$ .
	$(x,y)=(2e^{6t}+3e^{2t},3e^{6t}+2e^{2t})$ .
	$(x,y)=(3e^{2t},2e^{6t})$ .
	$(x,y)=(3e^{6t},2e^{2t})$ .

	不存在这样的 $k$ 。
	$k=0$
	$k=1$
	$k$ 可以是任意实数。

	该系统不一致。
	$(x,y,z)=(2,3,8)$
	$(x,y,z)=(-6,1,2)$
	$(x,y,z)=(-6t,t,2t)$
	$(x,y,z)=(2t+2,3t+3,8t+8)$
	$(x,y,z)=(-6t+2,t+3,2t+8)$
	$(x,y,z)=(2t-6,3t+1,8t+2)$

	零矩阵。
	$2I.$
	对角矩阵。