引言
"矩阵"可能更广为人知的是大型计算机模拟,但在数学中,它完全是另一回事。更准确地说,矩阵(复数形式为 matrices)是由数字组成的矩形阵列。例如,下面是写矩阵的典型方式,数字排列成行和列,并在数字周围加上圆括号

上述矩阵有4行4列,因此我们称之为4 × 4(4乘4)矩阵。此外,我们还可以有许多不同形状的矩阵。矩阵的形状是指矩阵的维度(m乘n,其中m是行数,n是列数)。以下是一些矩阵的示例
这是一个3 × 3矩阵的示例

这是一个5 × 4矩阵的示例

这是一个1 × 6矩阵的示例

矩阵理论与(线性)联立方程的理论密切相关。古代中国人已经建立了解决联立方程的系统方法。联立方程理论在东方由日本数学家关孝和进一步发展,稍后由莱布尼茨(牛顿最伟大的竞争对手)发展。后来,现代数学三大巨匠之一的高斯(1777-1855)推广了高斯消元法的使用,这是一种解决任意数量线性联立方程的简单逐步算法。到那时,用矩阵来表示纸上的联立方程(如上所述)已经变得相当普遍1。
考虑以下联立方程


它的解是x = 7 和 y = 3,通常的解法是将两个方程相加以消去y。矩阵理论为我们提供了另一种通过矩阵乘法(如下所述)来解决上述联立方程的方法。我们将研究广泛接受的乘法两个矩阵的方法。理论上,通过矩阵乘法,我们可以解决任意数量的联立方程,但我们将主要关注2 × 2矩阵。但即使有这种限制,我们也为联立方程无法提供的主题打开了大门。两个这样的例子是
- 使用矩阵解决线性递推关系,可用于模拟人口增长,以及
- 使用矩阵加密消息。
我们将从学习一些更基本的矩阵概念开始我们的研究。一旦我们牢牢掌握了基础知识,我们将继续学习本章的重点内容,即矩阵乘法。
元素
矩阵的元素是矩阵内部的特定数字,它由一对数字唯一地定位。例如,让以下矩阵用A表示,或用符号表示

A的第(2,2)个元素是5;A的第(1,1)个元素是1,A的第(3,3)个元素是9,A的第(2,3)个元素是8。A的第(i , j)个元素通常表示为ai,j,矩阵B的第(i , j)个元素通常表示为bi,j,依此类推。
总结
- 矩阵是数字的数组
- m×n矩阵有m行和n列
- 矩阵的形状由其行数和列数决定
- 矩阵的第(i,j)个元素位于第i行和第j列
矩阵加法和标量乘法
矩阵可以相加。但只有相同形状的矩阵才能相加。这是非常自然的。例如


那么

类似地,矩阵可以乘以一个数。我们将这个数称为标量,以区别于矩阵。读者不必担心这里的定义,只需记住标量只是一个数字。

在这种情况下,标量值为 5。通常,当我们进行s × A时,其中s是标量,A是矩阵,我们将A的每个元素乘以s。
矩阵乘法
将两个矩阵相乘的普遍接受方法绝对不直观。如上所述,乘法可以帮助求解联立方程。我们现在将简要概述如何做到这一点。首先,任何线性联立方程组都可以写成系数矩阵乘以未知数矩阵等于结果矩阵的形式。这个描述可能听起来有点复杂,但在符号形式下它非常清楚。前面的陈述只是说,如果A、x和b是矩阵,那么Ax = b可以用来表示某个联立方程组。矩阵乘法的妙处在于,某些矩阵可以具有乘法逆元,也就是说,我们可以将方程两边都乘以A-1得到x = A-1b,这有效地解决了联立方程。
随着本章的进行,读者一定会更好地理解矩阵乘法。现在,我们应该考虑矩阵乘法最简单的情况,即乘以向量。我们将看到一些例子,然后我们将解释乘法的过程。

那么

类似地,如果

那么
仅有一行的矩阵称为行向量,类似地,仅有一列的矩阵称为列向量。当我们将行向量A乘以列向量B时,我们将A的第一列中的元素乘以B的第一行中的元素,并将A的第二列和B的第二行的乘积加到该结果上,以此类推。更一般地,我们将a1,i乘以bi,1(其中i的范围从1到n,即行/列的数量),并将所有乘积加起来。符号表示为
(有关
符号的信息,请参见求和符号)
- 其中n是行/列的数量。
- 换句话说:列向量和行向量的乘积是行向量中第1,i个元素与列向量中第i,1个元素的乘积之和,其中i的范围从1到这些向量的宽度/高度。
注意:矩阵的乘积也是一个矩阵。行向量和列向量的乘积是一个1×1的矩阵,而不是一个标量。
练习
计算






非向量矩阵的乘法
假设
,其中A、B和C是矩阵。我们将A的第i行与B的第j列相乘,就像它们是向量矩阵一样。所得数字是C的第(i,j)个元素。符号表示为

示例1
计算AB = C和BA= D,其中

以及

解答




即





即

例2 计算AB 和 BA,其中


解答


示例 3 计算AB 和 BA,其中


解答


示例 4 计算以下乘法

解答
注意

是一个 2 行 1 列的矩阵,并且

是一个 1 行 2 列的矩阵。因此,乘法是有意义的,乘积应该是一个 2 行 2 列的矩阵。

示例 5 计算以下乘法

解答

例 6 计算以下乘法

解答 
例 7 计算以下乘法

解答 
注意 矩阵的乘法通常不满足交换律,即通常AB ≠ BA。
对角矩阵
对角矩阵是指除了主对角线上的元素外,其他所有元素都为零的矩阵。对角矩阵的乘法非常方便,只需要将对角线上的元素相乘即可。
示例
以下是所有对角矩阵 
例 1 
例2 
以上例子表明,如果D是一个对角矩阵,那么Dk非常容易计算,我们只需要将对角线上的元素取k次幂即可。这在后面学习如何使用矩阵计算第n个斐波那契数时将是一个非常有用的事实。
练习
1. 指出C的维度
- a) C = An×pBp×m
- b)

2. 计算结果。请注意,在矩阵乘法中(AB)C = A(BC),即乘法的顺序并不重要(稍后证明)。
- a)

- b)

3. 执行以下乘法


你发现了什么?
单位矩阵与乘法法则
上面的练习向我们展示了矩阵

非常特殊。它被称为2×2单位矩阵。单位矩阵是一个方阵,其对角线上的元素为1,其他所有元素都为零。单位矩阵I具有以下非常特殊的性质


对于所有矩阵A都成立。我们通常不会指定单位矩阵的形状,因为这从上下文中很明显,并且在本章中我们只处理 2×2 的单位矩阵。在实数系统中,数字 1 满足:r × 1 = r = 1 × r,因此很清楚,单位矩阵类似于“1”。
结合律、分配律和(非)交换律
矩阵乘法与我们从实数乘法中知道的乘法有很大不同。因此,令人欣慰的是,实数满足的许多定律也适用于矩阵世界。但是有一个重要的例外,一般情况下AB ≠ BA。
设A、B和C为矩阵。结合律意味着
- (AB)C = A(BC)
也就是说,你乘以矩阵的顺序并不重要,因为无论你进行乘法的顺序如何,你得到的最终结果都是相同的。
另一方面,分配律意味着
- A(B + C) = AB + AC
以及
- (A + B)C = AC + BC
注意:实数的交换律(即 ab = ba)不适用于矩阵世界。
说服你自己
对于所有 2×2 矩阵A、B和C。以及单位矩阵I。
1. 说服自己在 2×2 的情况下
- A(B + C) = AB + AC
以及
- (A + B)C = AC + BC
2. 说服自己在 2×2 的情况下
- A(BC) = (AB)C
3. 说服你自己

一般情况下。AB = BA 在什么时候成立?至少举出一个例子。
请注意,以上所有内容对所有矩阵(任何维度/形状)都适用。
行列式和逆矩阵
我们将考虑联立方程
- ax + by = α (1)
- cx + dy = β (2)
其中a、b、c、d、α和β是常数。我们想要确定 (1) 和 (2) 对x和y具有唯一解的必要条件。我们继续
- 令 (1') = (1) × c
- 令 (2') = (2) × a
即
- acx + bcy = cα (1')
- acx + ady = aβ (2')
现在
- 令 (3) = (2') - (1')
- (ad - bc)y = aβ - cα (3)
现在,当且仅当 (ad - bc) ≠ 0 时,y可以唯一确定。因此,(1) 和 (2) 具有唯一解的必要条件取决于x和y的所有四个系数。我们将此数 (ad - bc) 称为行列式,因为它告诉我们两个二元联立方程是否存在唯一解。总之
- 如果 (ad - bc) = 0,则不存在唯一解
- 如果 (ad - bc) ≠ 0,则存在唯一解。
注意:唯一,我们再怎么强调这个词都不为过。如果行列式为零,并不一定意味着联立方程没有解!考虑
- x + y = 2
- 7x + 7y = 14
上述方程组的行列式为零,但显然存在解,即x = y = 1。事实上,存在无限多个解!另一方面,也考虑
- x + y = 1
- x + y = 2
这组方程的行列式为零,并且根本没有解。因此,如果行列式为零,则要么没有解,要么有无限多个解。
矩阵的行列式
我们定义 2×2 矩阵的行列式

为

逆矩阵
也许在这个阶段,det(A) 的用途还不十分清楚。但它与逆矩阵的概念密切相关。考虑实数系统中的一个数b,它具有(乘法)逆元 1/b,即b(1/b) = (1/b)b = 1。我们知道当b = 0 时,1/b不存在。
在矩阵世界中,矩阵A是否具有逆矩阵取决于行列式 det(A) 的值!这是怎么回事?假设A(已知)确实有逆矩阵B(即AB = I = BA)。所以我们的目标是找到B。进一步假设

以及

我们需要解四个联立方程,以根据a、b、c、d和 det(A) 得到w、x、y和z的值。
- aw + by = 1
- cw + dy = 0
- ax + bz = 0
- cx + dz = 1
读者可以自己尝试解以上方程。所需的答案是

在这里,我们假设A有逆矩阵,但如果 det(A) = 0,则没有意义,因为我们不能除以零。因此,A-1(A的逆矩阵)存在当且仅当 det(A) ≠ 0。
总结
如果AB = BA = I,则我们说B是A的逆矩阵。我们用A-1表示A的逆矩阵。2×2 矩阵的逆矩阵

是

前提是A的行列式不为零。
解联立方程
假设我们要解
- ax + by = α
- cx + dy = β
我们令



我们可以将其转换为矩阵形式

即

如果A的行列式不为零,则我们可以用A-1(A的逆矩阵)左乘等式两边

即

这意味着x和y是唯一的。
示例
求A的逆矩阵(如果存在)
- a)

- b)

- c)

- d)

解答
- a)

- b)

- c) 无解,因为det(A) = 3ab - 3ab = 0
- d)

练习
1. 求以下矩阵的行列式
。利用A的行列式,判断以下联立方程是否有唯一解

2. 假设
- C = AB
证明
- det(C) = det(A)det(B)
对于 2 × 2 的情况。注意:这对于所有情况都成立。
3. 证明如果交换A的行得到A' ,则 det(A) = -det(A' )
4. 利用结果 2
a) 证明如果

则 det(A) = det(B)
b) 证明如果
- Ak = 0
对于某个正整数k,则 det(A) = 0。
5. a) 计算A5,即把A自身乘以5次,其中

b) 求P的逆矩阵,其中

c) 验证

d) 利用(b)和(c)部分的结果计算A5。
e) 计算A100
其他部分
下一部分 > High_School_Mathematics_Extensions/Matrices/Linear_Recurrence_Relations_Revisited
习题集 > High_School_Mathematics_Extensions/Matrices/Problem Set
项目 > High_School_Mathematics_Extensions/Matrices/Project/Elementary_Matrices
*线性递推关系再探*
我们已经在计数与生成函数章节中讨论过线性递推关系。我们将使用矩阵再次研究它。考虑斐波那契数列
- 1, 1, 2, 3, 5, 8, 13, 21...
其中每个数都是前两个数的和。令xn为第(n + 1)个斐波那契数,我们可以写成

事实上,许多线性递推关系可以用矩阵形式表示,例如



可以表示为

因此

所以,如果我们知道如何快速计算矩阵的幂,那么我们就可以很快算出第 (n + 1) 个斐波那契数!
快速计算幂
注意,从现在开始,如果一个矩阵是向量,我们会在其上方写一个箭头来强调。
考虑



当你用 A 乘以
或
时,会发生一些有趣的事情(试试看)。事实上

以及
.
通常对于矩阵 B,如果向量 w ≠ 0(所有元素都为零的矩阵),使得

对于某个标量 λ,则
称为 B 的特征向量,λ 为 B 的特征值(对应于 w)。
这是矩阵的一个特性,可以用来轻松计算幂。以下是使用上面提到的 A、x 和 y 将这两条信息组合成矩阵形式的方法

或者完全用数字形式表示

鼓励您检查以上结果是否正确。我们所做的是将
和
合并成一个矩阵,每个向量作为一列,然后将其乘以对角矩阵,该矩阵的元素分别对应每个特征向量的特征值。
如何利用这种矩阵形式快速计算A的幂?我们需要一个简单而巧妙的步骤——在等式的两边右乘(即从右边乘)
- 的逆矩阵。
我们得到

现在要计算An,我们只需要做


但是逆矩阵相乘得到I,所以我们剩下

这很容易计算,因为对角矩阵的幂很容易计算(只需将每个元素取幂)。
示例1
计算A5,其中A如上所示。
解 我们进行以下计算



例2
令

并且它的特征向量是
和 
直接计算B5(可选),并使用上述方法再次计算。
解 我们首先需要确定它的特征值。我们进行以下计算

所以对应于

的特征值为1。
类似地,

所以另一个特征值为3。
现在我们用以下形式写出它们

现在使B成为主语

现在

- 所以将右侧展开,我们得到
总结 -- 快速计算幂
给定矩阵A的特征向量
- 计算特征值(如果未给出)
- 写成A = PDP-1的形式,其中D是特征值的对角矩阵,P是特征向量作为列
- 使用右侧等价物计算An
练习
1. 的特征向量

是
和 
计算B5
2. 的特征向量

是
和 
计算B5
3. 的特征向量

是
和 
计算B5
特征向量和特征值
我们从上一节知道,对于一个矩阵,如果给定它的特征向量,我们可以找到对应的特征值,然后可以快速计算它的幂。所以最后一个障碍变成了找到特征向量。
矩阵 *A* 的特征向量
及其对应的特征值 λ 由以下表达式相关联

其中 x ≠ *0*,其中 *0* 是零矩阵(所有元素都为零)。我们可以安全地假设 *A* 是给定的,所以有两个未知数——
和 λ。我们现在有足够的信息来计算特征值(以及由此计算特征向量)



矩阵 (*A* - λ*I*) 必须 *没有* 逆矩阵,因为如果它有逆矩阵,那么
= *0*。因此 det(*A* - λ*I*) = 0。假设

那么


现在我们看到 det(A-λI) 是 λ 的多项式,并且 det(*A*-λ*I*) = 0。我们已经很好地训练了解二次方程,所以很容易计算出 λ 的值。一旦我们计算出 λ 的值,我们就可以计算出
(参见示例)。
示例1
求以下矩阵的特征值和特征向量

然后找到 *D* 和 *P*,使得 *A* = *P*-1*DP*。
解答
我们的目标是找到
和 λ,使得
- x
= λx
我们继续进行

(**)
- det(A - λI) =
- 0 = (-4 - λ)(7 - λ) + 30
- 0 = -28 - 3λ + λ2 + 30
- 0 = λ2 - 3λ + 2
- 0 = (λ - 1)(λ - 2)
- λ = 1, 2
现在对于每个特征值,我们将得到一个不同的对应特征向量。因此我们分别考虑λ = 1和λ = 2的情况。
首先考虑λ = 1,从(**)我们得到

即

其中x
由于det(A - λI) = 0,我们知道上述方程没有唯一的解。但我们注意到

对于任何实数t都是一个解,我们选择t = 1作为我们的解,因为它最简单。因此

是对应于λ = 1的特征向量。(***)
类似地,如果λ = 2,从(**)我们得到

即

其中x
我们注意到

对于任意实数t 都是一个解,如同之前我们选择t = 1作为我们的解。因此
是对应于λ = 2的特征向量。(****)
我们总结(***)和(****)的结果,得到


我们将这些结果合并成一个

因此

例2
- a) 对角化A,即找到P(可逆)和B(对角)使得AP = PB
- b) 计算A5

解答 a) 我们正在求解Ax = λx,其中λ是一个常数,x′是一个列向量。首先


由于'x′ ≠ 0,我们有

即



对于λ = 3,


显然

是一个解。注意我们不接受x = 0作为解,因为我们假设x ≠ 0。还要注意

对于某个常数t 也是一个解。实际上,我们可以使用x = y = 2、3 或 4 作为解,但为了方便起见,我们选择最简单的,即x = y = 1。
对于 λ = 2,


显然

是一个解。
因此

是一个解,并且

也是一个解。
- b)




示例 3
解线性递推关系

解答

我们需要对角化

我们继续进行

我们得到
- λ = 2, 3
对于 λ = 2


对于 λ = 3


因此

现在



因此


即

练习
1. 计算A5,其中

2. 计算A5,其中

3. 求解以下递推关系


解答
1.

2.

更多应用
… 更多内容即将推出
习题集 > High_School_Mathematics_Extensions/Matrices/Problem Set
项目 > High_School_Mathematics_Extensions/Matrices/Project/Elementary_Matrices
反馈
您觉得怎么样? 太简单还是太难?信息过多还是不足?我们如何改进?请在讨论标签中留下评论告诉我们。更好的是,自己编辑它并使其变得更好。