特征值和特征向量与矩阵的基本属性有关。
- “特征值”一词来自德语“Eigenwert”,意思是“适当的或特征的价值”。
大型矩阵在计算时间方面可能很昂贵,并且可能需要进行数百或数千次迭代才能进行计算。此外,在没有重要数学工具的情况下,矩阵的行为将难以探索。一个数学工具,不仅对线性代数有应用,而且对微分方程、微积分和许多其他领域也有应用,那就是特征值和特征向量的概念。特征值和特征向量基于线性系统中的常见行为。让我们看一个例子。
让

和

如果A转换x和y会发生什么?好吧,


但值得注意的是


因此,当我们用矩阵A对向量x进行操作时,我们不会得到一个不同的向量(就像我们通常做的那样),而是得到相同的向量x乘以某个常数。向量y也是如此。
我们将值 1 和 -2 称为矩阵A的特征值,而向量x和y称为矩阵A的特征向量。
我们现在将这种矩阵/向量乘积与上面标量乘积相同的概念推广:本质上,如果我们有一个n×n矩阵 A,我们在v中寻找解以找到特征向量,并在λ中寻找解以找到方程的特征值
- Av=λv
我们该怎么做呢?让我们重新排列方程
- Av-λv=0
- (A-λI)v=0(注意我们必须将标量乘以单位矩阵,否则 A-λ 毫无意义)
但是 (A-λI) 是一个矩阵,所以我们试图解决 Bv=0,其中 B=(A-λI),而这个解仅仅是 B 的核,ker B。因此,特征向量位于 ker (A-λI) 中,其中 λ 是一个特征值。但我们如何找到特征值呢?
Bv=0 具有非零解,如果 |B| = det(B) 为零。因此,为了找到特征值,我们让 |A-λI|=0,然后求解 λ。因此,我们将获得一个关于复数的多项式方程(特征值可以是复数),称为特征方程。特征方程的根是特征值。
注意,我们排除0 作为特征向量,因为它平凡地是 Av=λv 的解,而且实际上我们并不关心它。此外,如果将零向量包括在内,它将允许无限多个特征值,因为 λ 的任何值都满足 A0=λ0。
如果我们有一个矩阵 A 的特征值 λ,以及相应的特征向量x,那么x的任何倍数也是相同特征值的特征向量。要看到 kx 也是一个特征向量,请遵循此论点:如果 Ax=λx,那么 A(kx)=kAx=kλx=λ(kx)。(这里 k 可以是任何标量。)因此,特征向量的每个倍数也是一个特征向量。
注意这里的非对称性:特征值是唯一的,而一个特征值有多个特征向量。</gallery> </gallery> </gallery> 粗体文本Æə=== 查找特征值和特征向量 === 以下是一些使用我们的定义查找特征值和特征向量的示例。
让

首先,我们将 |A-λI|=0 展开以求得特征值




现在,初等代数告诉我们这个方程的根是 3 和 2,因此它们是我们的特征值。
(练习:证明在 2×2 三角矩阵中,特征值位于主对角线上。更难的是:推广这个结果)
现在我们可以找到我们的特征向量。考虑第一个特征值 λ=3。为了找到我们的第一个特征向量

在这一点上我们可以进行行变换和回代,但通常猜测核就足够了,因为我们的矩阵很小,并且我们有线性相关的列。现在,观察

因此,对于任何标量 a,向量
是一个特征向量。换句话说,矩阵 A 的所有特征向量的集合包括集合
。在平面上,这表示一条斜率为 -1,通过原点的直线。
如上所述,矩阵的特征值是唯一确定的,但对于每个特征值,都有许多特征向量。我们通常选择一个特征向量,以便“大多数条目为整数”、“第一个条目为 1”或“特征向量的长度为 1”。大多数计算机代数系统为特征向量选择单位向量。
因此,在这里我们可以取
作为特征向量,例如。
类似地,对于我们的第二个特征值 λ=2,为了找到我们的第二个特征向量

因此,我们选择第二个特征向量为

我们的特征值为λ=2,3,特征向量为
,可以通过将每个向量与给定矩阵相乘进行验证。
(我们也可以选择
作为特征值λ=3的特征向量。请验证一下。)
根据以上内容,求解以下矩阵的特征值和特征向量(偶数题答案在后面给出)



- (较难。提示:一个特征值为4。)
- 特征值:3, 5; 特征向量:

- 特征值:-2, 2; 特征向量:

- 特征值: -3, 1, 4;特征向量:

特征值和特征向量不仅仅是关于这些向量的漂亮事实;它们具有相关且重要的应用。
让我们首先考察一类称为对角矩阵的矩阵:这些矩阵的形式为

现在,观察到

这是一个有用的性质!但是,我们可以应用此事实的矩阵数量显然是有限的,所以我们问自己是否可以将给定矩阵转换为对角矩阵。
这个问题的答案是“有时”,但目前,我们只关注答案为“是”的矩阵。
我们寻找的是一个矩阵 P 使得
- PAP-1=D
其中 D 是对角矩阵。
如果这样的矩阵 P 存在,我们就说 A 是可对角化的。(注意,xyx-1 通常被称为相似变换)。
那么
- PAP-1=D
- AP-1=P-1D
通过将整个公式乘以 P-1,然后
- A=P-1DP
通过将公式乘以 P。
现在,我们有
- Ak=(P-1DP)k
- =(P-1DP)(P-1DP)(P-1DP)... (k 次)
- =P-1D(PP-1)D(PP-1)DP... (k 次)
PP-1 项相互抵消,得到
- =P-1DDD...P (k 次)
- =P-1DkP
我们可以很容易地计算出 Dk,所以我们需要找到 P。
事实证明(整个证明相当困难),我们只需要从连接线性无关的特征向量来创建一个矩阵来创建 P。
然后,D 是一个对角矩阵,其中主对角线包含与相关特征向量相对应的特征值(第一个位置的特征值对应于它所创建的特征向量,在第一列)。
让我们通过一个示例来展示这些想法。

所以,如果我们想找到 A14,我们该怎么做?让我们使用我们刚刚描述的方法。
找到特征值
- |A-λI|=0
- (3-λ)(-λ)-4=0
- λ2-3λ-4=0
- λ=-1, 4
找到特征向量
- 对于 λ=-1

- 对于 λ=4

那么,特征向量为

因此,将特征向量组合起来形成矩阵 P

现在,-1 生成第一列中的特征向量,而 4 生成第二列中的特征向量,因此按照这种方式形成 D

我们可以很容易地计算 (-1)14=1,因此我们得到

并且我们有用于创建 2×2 矩阵的逆矩阵的快速方法

所以现在我们可以直接将它们相乘

简化后,我们得到

根据以上内容,求解以下矩阵幂(偶数编号问题的答案如下)




- (更繁琐:只因为这个矩阵是行阶梯形式,所以只有一点点更容易)
- 2.

- 4.

我们可以使用对角化方法来求解耦合常微分方程。例如,令 x(t) 和 y(t) 是可微函数,x' 和 y' 是它们的导数。微分方程相对难以求解
- x' = 4x - y
- y' = 2x + y
但是
- 对于常数 k,u' = ku 很容易求解
它的解是
- u = Aekx 其中 A 是一个常数
记住这个事实,我们将 ODE 转换为矩阵形式

对角化方阵,我们得到

我们放入

然后它随之而来

因此

如上所述,解决方案很简单。我们有


其中 C 和 D 是常数。现在我们有

得到

因此


这种方法可以很好地推广到更高维度。
奇怪的是,矩阵在微积分中与联立微分方程的解的计算有很大的关系,其中一个微分方程的函数依赖于另一个微分方程。例如
- D y = 3y + x
- D x = y + 3x
不用再深入研究,这些微分方程的解看起来很复杂!但是,如果我们用矩阵的形式来表达,分析起来会容易一些。
让我们以上面的例子为例,所以
- D y(t) = 3y + x
- D x(t) = y + 3x
现在形成一个向量

那么

现在问题变成了

这让人想起我们在微积分中已经遇到的微分方程,即
- D y = ky
其中解为 y = cekt。我们可以大胆猜测上面的矩阵方程的解将具有类似的形式。
所以让我们尝试一个解 v = weλt。然后 D v = λweλt。
然后让我们尝试将这个猜想解代入我们的方程

如果我们设

我们看到上面的方程在除以
(因为它永远不等于零)后变成

但是等等——这是找到特征值的方程式,并且我们有解 **v** = **w**eλt 是一个解,当且仅当 λ 是 A 的特征值并且 **w** 是其对应的特征向量。
特征值为 4, 2,特征向量分别为

。
因此,我们有两个解

和

请注意,如果我们对微分方程 D **v** = A**v** 有两个解,那么这两个解的线性组合将给出相同的解。所以我们有下面的通解


将它们分成第一个和第二个分量,我们得到两个解
.
根据上述内容,解决以下问题(偶数题答案如下)
- 求 y(t) 和 x(t),其中 D y(t)=3x(t)+6y(t) 且 D x(t)=x(t)+4y(t)
- 求 y(t) 和 x(t),其中 D y(t)=2x(t)+2y(t) 且 D x(t)=x(t)-2y(t)
构成矩阵

该矩阵的特征值为

特征向量为

所以现在

并且 y(t) 和 x(t) 可以通过观察直接得出。