线性代数/特征值和特征向量

特征值和特征向量与矩阵的基本属性有关。

“特征值”一词来自德语“Eigenwert”，意思是“适当的或特征的价值”。

动机

大型矩阵在计算时间方面可能很昂贵，并且可能需要进行数百或数千次迭代才能进行计算。此外，在没有重要数学工具的情况下，矩阵的行为将难以探索。一个数学工具，不仅对线性代数有应用，而且对微分方程、微积分和许多其他领域也有应用，那就是特征值和特征向量的概念。特征值和特征向量基于线性系统中的常见行为。让我们看一个例子。

让

A={\begin{pmatrix}1&2\\0&-2\\\end{pmatrix}}

和

\mathbf {x} ={\begin{pmatrix}-2\\3\\\end{pmatrix}},\quad \mathbf {y} ={\begin{pmatrix}1\\0\\\end{pmatrix}}.

如果A转换x和y会发生什么？好吧，

A\mathbf {x} ={\begin{pmatrix}4\\-6\\\end{pmatrix}}

A\mathbf {y} ={\begin{pmatrix}1\\0\\\end{pmatrix}}

但值得注意的是

A\mathbf {x} =(-2){\begin{pmatrix}-2\\3\\\end{pmatrix}}=-2\mathbf {x}

A\mathbf {y} =(1){\begin{pmatrix}1\\0\\\end{pmatrix}}=\mathbf {y} =(1)\mathbf {y}

因此，当我们用矩阵A对向量x进行操作时，我们不会得到一个不同的向量（就像我们通常做的那样），而是得到相同的向量x乘以某个常数。向量y也是如此。

我们将值 1 和 -2 称为矩阵A的特征值，而向量x和y称为矩阵A的特征向量。

定义

我们现在将这种矩阵/向量乘积与上面标量乘积相同的概念推广：本质上，如果我们有一个n×n矩阵 A，我们在v中寻找解以找到特征向量，并在λ中寻找解以找到方程的特征值

Av=λv

我们该怎么做呢？让我们重新排列方程

Av-λv=0

(A-λI)v=0（注意我们必须将标量乘以单位矩阵，否则 A-λ 毫无意义）

但是 (A-λI) 是一个矩阵，所以我们试图解决 Bv=0，其中 B=(A-λI)，而这个解仅仅是 B 的核，ker B。因此，特征向量位于 ker (A-λI) 中，其中 λ 是一个特征值。但我们如何找到特征值呢？

Bv=0 具有非零解，如果 |B| = det(B) 为零。因此，为了找到特征值，我们让 |A-λI|=0，然后求解 λ。因此，我们将获得一个关于复数的多项式方程（特征值可以是复数），称为特征方程。特征方程的根是特征值。

注意，我们排除0 作为特征向量，因为它平凡地是 Av=λv 的解，而且实际上我们并不关心它。此外，如果将零向量包括在内，它将允许无限多个特征值，因为 λ 的任何值都满足 A0=λ0。

如果我们有一个矩阵 A 的特征值 λ，以及相应的特征向量x，那么x的任何倍数也是相同特征值的特征向量。要看到 kx 也是一个特征向量，请遵循此论点：如果 Ax=λx，那么 A(kx)=kAx=kλx=λ(kx)。（这里 k 可以是任何标量。）因此，特征向量的每个倍数也是一个特征向量。

注意这里的非对称性：特征值是唯一的，而一个特征值有多个特征向量。</gallery> </gallery> </gallery> ~~粗体文本~~Æə=== 查找特征值和特征向量 === 以下是一些使用我们的定义查找特征值和特征向量的示例。

让

A={\begin{pmatrix}3&0\\-1&2\end{pmatrix}}

首先，我们将 |A-λI|=0 展开以求得特征值

\left|{\begin{pmatrix}3&0\\-1&2\end{pmatrix}}-{\begin{pmatrix}\lambda &0\\0&\lambda \end{pmatrix}}\right|=0

{\begin{vmatrix}3-\lambda &0\\-1&2-\lambda \end{vmatrix}}=0

(3-\lambda )(2-\lambda )-(0)(-1)=0

(3-\lambda )(2-\lambda )=0

现在，初等代数告诉我们这个方程的根是 3 和 2，因此它们是我们的特征值。

(练习：证明在 2×2 三角矩阵中，特征值位于主对角线上。更难的是：推广这个结果)

现在我们可以找到我们的特征向量。考虑第一个特征值 λ=3。为了找到我们的第一个特征向量

{\mbox{ker}}(A-3I)={\mbox{ker}}{\begin{pmatrix}3-3&0\\-1&2-3\end{pmatrix}}={\mbox{ker}}{\begin{pmatrix}0&0\\-1&-1\end{pmatrix}}

在这一点上我们可以进行行变换和回代，但通常猜测核就足够了，因为我们的矩阵很小，并且我们有线性相关的列。现在，观察

{\begin{pmatrix}0&0\\-1&-1\end{pmatrix}}{\begin{pmatrix}a\\-a\end{pmatrix}}=\mathbf {0}

因此，对于任何标量 a，向量

{\begin{pmatrix}a\\-a\end{pmatrix}}

是一个特征向量。换句话说，矩阵 A 的所有特征向量的集合包括集合

{\mbox{span}}\{{\begin{pmatrix}1\\-1\end{pmatrix}}\}

。在平面上，这表示一条斜率为 -1，通过原点的直线。

如上所述，矩阵的特征值是唯一确定的，但对于每个特征值，都有许多特征向量。我们通常选择一个特征向量，以便“大多数条目为整数”、“第一个条目为 1”或“特征向量的长度为 1”。大多数计算机代数系统为特征向量选择单位向量。

因此，在这里我们可以取 ${\begin{pmatrix}1\\-1\end{pmatrix}}$ 作为特征向量，例如。

类似地，对于我们的第二个特征值 λ=2，为了找到我们的第二个特征向量

{\mbox{ker}}(A-2I)={\mbox{ker}}{\begin{pmatrix}1&0\\-1&0\end{pmatrix}}={\mbox{span}}\{{\begin{pmatrix}0\\1\end{pmatrix}}\}=\mathbf {0}

因此，我们选择第二个特征向量为

{\begin{pmatrix}0\\1\end{pmatrix}}.

我们的特征值为λ=2,3，特征向量为 ${\begin{pmatrix}1\\-1\end{pmatrix}},{\begin{pmatrix}0\\1\end{pmatrix}}$ ，可以通过将每个向量与给定矩阵相乘进行验证。

（我们也可以选择 ${\begin{pmatrix}1/{\sqrt {(}}2)\\-1/{\sqrt {(}}2)\end{pmatrix}}$ 作为特征值λ=3的特征向量。请验证一下。）

问题集

根据以上内容，求解以下矩阵的特征值和特征向量（偶数题答案在后面给出）

${\begin{pmatrix}3&0\\-4&5\end{pmatrix}}$
${\begin{pmatrix}1&1\\3&-1\end{pmatrix}}$
${\begin{pmatrix}-2&0&3\\2&4&0\\1&0&0\end{pmatrix}}$

（较难。提示：一个特征值为4。）

答案

特征值：3, 5; 特征向量： ${\begin{pmatrix}1\\2\end{pmatrix}},{\begin{pmatrix}0\\1\end{pmatrix}}$
特征值：-2, 2; 特征向量： ${\begin{pmatrix}-1\\3\end{pmatrix}},{\begin{pmatrix}1\\1\end{pmatrix}}$
特征值： -3, 1, 4；特征向量： ${\begin{pmatrix}21\\-6\\-7\end{pmatrix}},{\begin{pmatrix}3\\-2\\3\end{pmatrix}},{\begin{pmatrix}0\\1\\0\end{pmatrix}}$