跳转到内容

线性代数/特征值和特征向量

来自维基教科书,开放的书籍,开放的世界

特征值和特征向量与矩阵的基本属性有关。

“特征值”一词来自德语“Eigenwert”,意思是“适当的或特征的价值”。

大型矩阵在计算时间方面可能很昂贵,并且可能需要进行数百或数千次迭代才能进行计算。此外,在没有重要数学工具的情况下,矩阵的行为将难以探索。一个数学工具,不仅对线性代数有应用,而且对微分方程、微积分和许多其他领域也有应用,那就是特征值特征向量的概念。特征值和特征向量基于线性系统中的常见行为。让我们看一个例子。

如果A转换xy会发生什么?好吧,

但值得注意的是

因此,当我们用矩阵A对向量x进行操作时,我们不会得到一个不同的向量(就像我们通常做的那样),而是得到相同的向量x乘以某个常数。向量y也是如此。

我们将值 1 和 -2 称为矩阵A特征值,而向量xy称为矩阵A特征向量

我们现在将这种矩阵/向量乘积与上面标量乘积相同的概念推广:本质上,如果我们有一个n×n矩阵 A,我们在v中寻找解以找到特征向量,并在λ中寻找解以找到方程的特征值

Avv

我们该怎么做呢?让我们重新排列方程

Avv=0
(A-λI)v=0注意我们必须将标量乘以单位矩阵,否则 A-λ 毫无意义

但是 (A-λI) 是一个矩阵,所以我们试图解决 Bv=0,其中 B=(A-λI),而这个解仅仅是 B 的核,ker B。因此,特征向量位于 ker (A-λI) 中,其中 λ 是一个特征值。但我们如何找到特征值呢?

Bv=0 具有非零解,如果 |B| = det(B) 为零。因此,为了找到特征值,我们让 |A-λI|=0,然后求解 λ。因此,我们将获得一个关于复数的多项式方程(特征值可以是复数),称为特征方程。特征方程的根是特征值。

注意,我们排除0 作为特征向量,因为它平凡地是 Avv 的解,而且实际上我们并不关心它。此外,如果将零向量包括在内,它将允许无限多个特征值,因为 λ 的任何值都满足 A00

如果我们有一个矩阵 A 的特征值 λ,以及相应的特征向量x,那么x的任何倍数也是相同特征值的特征向量。要看到 kx 也是一个特征向量,请遵循此论点:如果 Axx,那么 A(kx)=kAx=kλx=λ(kx)。(这里 k 可以是任何标量。)因此,特征向量的每个倍数也是一个特征向量。

注意这里的非对称性:特征值是唯一的,而一个特征值有多个特征向量。</gallery> </gallery> </gallery> 粗体文本Æə=== 查找特征值和特征向量 === 以下是一些使用我们的定义查找特征值和特征向量的示例。

首先,我们将 |A-λI|=0 展开以求得特征值


现在,初等代数告诉我们这个方程的根是 3 和 2,因此它们是我们的特征值。

(练习:证明在 2×2 三角矩阵中,特征值位于主对角线上。更难的是:推广这个结果)

现在我们可以找到我们的特征向量。考虑第一个特征值 λ=3。为了找到我们的第一个特征向量

在这一点上我们可以进行行变换和回代,但通常猜测核就足够了,因为我们的矩阵很小,并且我们有线性相关的列。现在,观察

因此,对于任何标量 a,向量

是一个特征向量。换句话说,矩阵 A 的所有特征向量的集合包括集合 。在平面上,这表示一条斜率为 -1,通过原点的直线。

如上所述,矩阵的特征值是唯一确定的,但对于每个特征值,都有许多特征向量。我们通常选择一个特征向量,以便“大多数条目为整数”、“第一个条目为 1”或“特征向量的长度为 1”。大多数计算机代数系统为特征向量选择单位向量。

因此,在这里我们可以取 作为特征向量,例如。

类似地,对于我们的第二个特征值 λ=2,为了找到我们的第二个特征向量

因此,我们选择第二个特征向量为

我们的特征值为λ=2,3,特征向量为,可以通过将每个向量与给定矩阵相乘进行验证。

(我们也可以选择作为特征值λ=3的特征向量。请验证一下。)

问题集

[edit | edit source]

根据以上内容,求解以下矩阵的特征值和特征向量(偶数题答案在后面给出)

(较难。提示:一个特征值为4。)

答案

[edit | edit source]
  1. 特征值:3, 5; 特征向量:
  2. 特征值:-2, 2; 特征向量:
  3. 特征值: -3, 1, 4;特征向量:

特征值和特征向量不仅仅是关于这些向量的漂亮事实;它们具有相关且重要的应用。

矩阵幂

[编辑 | 编辑源代码]

让我们首先考察一类称为对角矩阵的矩阵:这些矩阵的形式为

现在,观察到

这是一个有用的性质!但是,我们可以应用此事实的矩阵数量显然是有限的,所以我们问自己是否可以将给定矩阵转换为对角矩阵。

这个问题的答案是“有时”,但目前,我们只关注答案为“是”的矩阵。

我们寻找的是一个矩阵 P 使得

PAP-1=D

其中 D 是对角矩阵。

如果这样的矩阵 P 存在,我们就说 A 是可对角化的。(注意,xyx-1 通常被称为相似变换)。

那么

PAP-1=D
AP-1=P-1D

通过将整个公式乘以 P-1,然后

A=P-1DP

通过将公式乘以 P。

现在,我们有

Ak=(P-1DP)k
=(P-1DP)(P-1DP)(P-1DP)... (k 次)
=P-1D(PP-1)D(PP-1)DP... (k 次)

PP-1 项相互抵消,得到

=P-1DDD...P (k 次)
=P-1DkP

我们可以很容易地计算出 Dk,所以我们需要找到 P。

事实证明(整个证明相当困难),我们只需要从连接线性无关的特征向量来创建一个矩阵来创建 P。

然后,D 是一个对角矩阵,其中主对角线包含与相关特征向量相对应的特征值(第一个位置的特征值对应于它所创建的特征向量,在第一列)。

让我们通过一个示例来展示这些想法。

所以,如果我们想找到 A14,我们该怎么做?让我们使用我们刚刚描述的方法。

找到特征值

|A-λI|=0
(3-λ)(-λ)-4=0
λ2-3λ-4=0
λ=-1, 4

找到特征向量

对于 λ=-1
对于 λ=4

那么,特征向量为

因此,将特征向量组合起来形成矩阵 P

现在,-1 生成第一列中的特征向量,而 4 生成第二列中的特征向量,因此按照这种方式形成 D

我们可以很容易地计算 (-1)14=1,因此我们得到

并且我们有用于创建 2×2 矩阵的逆矩阵的快速方法

所以现在我们可以直接将它们相乘

简化后,我们得到

问题集

[edit | edit source]

根据以上内容,求解以下矩阵幂(偶数编号问题的答案如下)

(更繁琐:只因为这个矩阵是行阶梯形式,所以只有一点点更容易)
2.
4.

耦合常微分方程

[编辑 | 编辑源代码]

我们可以使用对角化方法来求解耦合常微分方程。例如,令 x(t) 和 y(t) 是可微函数,x' 和 y' 是它们的导数。微分方程相对难以求解

x' = 4x - y
y' = 2x + y

但是

对于常数 k,u' = ku 很容易求解

它的解是

u = Aekx 其中 A 是一个常数

记住这个事实,我们将 ODE 转换为矩阵形式

对角化方阵,我们得到

我们放入

然后它随之而来

因此

如上所述,解决方案很简单。我们有

其中 C 和 D 是常数。现在我们有

得到

因此

这种方法可以很好地推广到更高维度。

联立微分方程

[edit | edit source]

奇怪的是,矩阵在微积分中与联立微分方程的解的计算有很大的关系,其中一个微分方程的函数依赖于另一个微分方程。例如

D y = 3y + x
D x = y + 3x

不用再深入研究,这些微分方程的解看起来很复杂!但是,如果我们用矩阵的形式来表达,分析起来会容易一些。

示例

[edit | edit source]

让我们以上面的例子为例,所以

D y(t) = 3y + x
D x(t) = y + 3x

现在形成一个向量

那么

现在问题变成了

这让人想起我们在微积分中已经遇到的微分方程,即

D y = ky

其中解为 y = cekt。我们可以大胆猜测上面的矩阵方程的解将具有类似的形式。

所以让我们尝试一个解 v = weλt。然后 D v = λweλt

然后让我们尝试将这个猜想解代入我们的方程

如果我们设

我们看到上面的方程在除以(因为它永远不等于零)后变成

但是等等——这是找到特征值的方程式,并且我们有解 **v** = **w**eλt 是一个解,当且仅当 λ 是 A 的特征值并且 **w** 是其对应的特征向量。

特征值为 4, 2,特征向量分别为

因此,我们有两个解

请注意,如果我们对微分方程 D **v** = A**v** 有两个解,那么这两个解的线性组合将给出相同的解。所以我们有下面的通解

将它们分成第一个和第二个分量,我们得到两个解

.

问题集

[edit | edit source]

根据上述内容,解决以下问题(偶数题答案如下)

  1. 求 y(t) 和 x(t),其中 D y(t)=3x(t)+6y(t) 且 D x(t)=x(t)+4y(t)
  2. 求 y(t) 和 x(t),其中 D y(t)=2x(t)+2y(t) 且 D x(t)=x(t)-2y(t)
答案
[edit | edit source]

构成矩阵

该矩阵的特征值为

特征向量为

所以现在

并且 y(t) 和 x(t) 可以通过观察直接得出。

[编辑 | 编辑源代码]
华夏公益教科书