线性代数/矩阵乘法的机制/解答

解答

建议所有读者完成此练习。

问题 1

预测每个初等行变换矩阵乘法的结果，然后通过计算结果来验证。

${\begin{pmatrix}3&0\\0&0\end{pmatrix}}{\begin{pmatrix}1&2\\3&4\end{pmatrix}}$
${\begin{pmatrix}4&0\\0&2\end{pmatrix}}{\begin{pmatrix}1&2\\3&4\end{pmatrix}}$
${\begin{pmatrix}1&0\\-2&1\end{pmatrix}}{\begin{pmatrix}1&2\\3&4\end{pmatrix}}$
${\begin{pmatrix}1&2\\3&4\end{pmatrix}}{\begin{pmatrix}1&-1\\0&1\end{pmatrix}}$
${\begin{pmatrix}1&2\\3&4\end{pmatrix}}{\begin{pmatrix}0&1\\1&0\end{pmatrix}}$

解答

第二个矩阵的第一行乘以 $3$ ，第二行乘以 $0$ 。
${\begin{pmatrix}3&6\\0&0\end{pmatrix}}$
第二个矩阵的第一行乘以 $4$ ，第二行乘以 $2$ 。
${\begin{pmatrix}4&8\\6&8\end{pmatrix}}$
第二个矩阵进行主元操作，将第二行替换为 $-2$ 乘以第一行加上第二行。
${\begin{pmatrix}1&2\\1&0\end{pmatrix}}$
第一个矩阵进行列操作：第二列替换为 $-1$ 乘以第一列加上第二列。
${\begin{pmatrix}1&1\\3&1\end{pmatrix}}$
第一个矩阵的列交换了。
${\begin{pmatrix}2&1\\4&3\end{pmatrix}}$

建议所有读者完成此练习。

问题 2

在实践中，经常需要对数字表格中的行和列进行线性组合。例如，这是佛蒙特州和纽约州部分地区的路线图。

部分原因是尚普兰湖，一些城镇之间没有直接连接的道路。例如，没有办法从威努斯基到格兰德艾尔而不经过科尔切斯特。（当然，为了简化图，许多其他道路和城镇被省略了。从地图顶部到底部大约四十英里。）

地图的关联矩阵是方阵，其 $i,j$ 项是从城市 $i$ 到城市 $j$ 的道路数量。生成此地图的关联矩阵（按字母顺序排列城市）。
如果矩阵等于其转置，则该矩阵为对称。证明关联矩阵是对称的。（这些都是双向街道。佛蒙特州没有多少单行道。）
关联矩阵的平方和立方的意义是什么？

解答

关联矩阵为（例如，第一行显示，包括伯灵顿在内的连接只有一条，即到威努斯基的道路）。
${\begin{pmatrix}0&0&0&0&1\\0&0&1&1&1\\0&1&0&1&0\\0&1&1&0&0\\1&1&0&0&0\end{pmatrix}}$
因为这些是双向道路，所以连接城市 $i$ 与城市 $j$ 的任何道路都提供了城市 $j$ 与城市 $i$ 之间的连接。
关联矩阵的平方表示城市之间通过两条道路的行程连接的方式。

建议所有读者完成此练习。

问题 3

此表列出了每个工人完成的每种类型的工作的小时数以及相关的工资率。使用矩阵计算应付的工资。

	正常工作	加班
艾伦	40	12
贝蒂	35	6
凯瑟琳	40	18
唐纳德	28	0

	工资
正常工作	$25.00
加班	$45.00

（备注。这与上一个问题一样，说明在实践中，我们经常希望在实际上并不关心任何相关的线性映射的情况下，计算行和列的线性组合。）

解答

应付给每个人的工资出现在两个数组的矩阵乘积中。

问题 4

求此矩阵与其转置的乘积。

{\begin{pmatrix}\cos \theta &-\sin \theta \\\sin \theta &\cos \theta \end{pmatrix}}

解答

该产品是单位矩阵（回想一下 $\cos ^{2}\theta +\sin ^{2}\theta =1$ ）。解释是，给定矩阵相对于标准基表示 $\mathbb {R} ^{2}$ 中的 $\theta$ 弧度的旋转，而转置表示 $-\theta$ 弧度的旋转。两者相互抵消。

建议所有读者完成此练习。

问题 5

证明对角矩阵构成 ${\mathcal {M}}_{n\!\times \!n}$ 的子空间。它的维数是多少？

解答

对角矩阵的集合非空，因为零矩阵是对角矩阵。显然它在标量倍数和和下封闭。因此，它是一个子空间。维数是 $n$ ；这里有一个基。

\{{\begin{pmatrix}1&0&\ldots \\0&0\\&&\ddots \\0&0&&0\end{pmatrix}},\ldots ,{\begin{pmatrix}0&0&\ldots \\0&0\\&&\ddots \\0&0&&1\end{pmatrix}}\}

问题 6

如果基不等，单位矩阵是否表示恒等映射？

解答

不。在 ${\mathcal {P}}_{1}$ 中，相对于不等基 $B=\langle 1,x\rangle$ 和 $D=\langle 1+x,1-x\rangle$ ，恒等变换由该矩阵表示。

{\rm {Rep}}_{B,D}({\text{id}})={\begin{pmatrix}1/2&1/2\\1/2&-1/2\end{pmatrix}}_{B,D}

问题 7

证明单位矩阵的每个倍数都与每个方阵可交换。还有其他与所有方阵可交换的矩阵吗？

解答

对于任何标量 $r$ 和方阵 $H$ ，我们有 $(rI)H=r(IH)=rH=r(HI)=(Hr)I=H(rI)$ .

没有其他这样的矩阵；这里有一个论证，适用于 $2\!\times \!2$ 矩阵，可以轻松扩展到 $n\!\times \!n$ 。如果一个矩阵与所有其他矩阵可交换，那么它与这个单位矩阵可交换。

{\begin{pmatrix}0&a\\0&c\end{pmatrix}}={\begin{pmatrix}a&b\\c&d\end{pmatrix}}{\begin{pmatrix}0&1\\0&0\end{pmatrix}}={\begin{pmatrix}0&1\\0&0\end{pmatrix}}{\begin{pmatrix}a&b\\c&d\end{pmatrix}}={\begin{pmatrix}c&d\\0&0\end{pmatrix}}

由此我们可以首先得出结论，左上角的条目 $a$ 必须等于它的右下角的条目 $d$ 。我们也得出结论，左下角的条目 $c$ 为零。右上角的条目 $b$ 的论证类似。

问题 8

证明或反驳：非奇异矩阵可交换。

解答

这是错误的；这两个矩阵不可交换。

{\begin{pmatrix}1&0\\0&0\end{pmatrix}}\qquad {\begin{pmatrix}0&0\\1&0\end{pmatrix}}

建议所有读者完成此练习。

问题 9

证明置换矩阵与其转置的乘积为单位矩阵。

解答

置换矩阵在每一行和每一列中只有一个 1，而所有其他条目都是零。固定这样一个矩阵。假设 $i$ 行的 1 在它的 $j$ 列。那么其他任何行都不会在 $j$ 列中有一个 1；其他每一行在 $j$ 列中有一个零。因此， $i$ 行与任何其他行的点积都为零。

乘积的 $i$ 行是由矩阵的 $i$ 行与转置的列的点积构成的。根据上一段，所有这样的点积都为零，除了 $i$ 个，它等于 1。

问题 10

证明如果 $G$ 的第一行和第二行相等，那么 $GH$ 的第一行和第二行也相等。推广此结论。

解答

泛化是指从第一行和第二行到第 $i_{1}$ 行和第 $i_{2}$ 行。 $GH$ 的第 $i$ 行由 $G$ 的第 $i$ 行和 $H$ 的各列的点积组成。因此，如果 $G$ 的第 $i_{1}$ 行和第 $i_{2}$ 行相等，那么 $GH$ 的第 $i_{1}$ 行和第 $i_{2}$ 行也是相等的。

问题 11

描述两个对角矩阵的乘积。

解答

如果两个对角矩阵的乘积是定义的——如果它们都是 $n\!\times \!n$ ——那么对角线的乘积就是乘积的对角线：其中 $G,H$ 是大小相同的对角矩阵， $GH$ 除了每个 $i,i$ 项为 $g_{i,i}h_{i,i}$ 外，其余都为零。

问题 12

写

{\begin{pmatrix}1&0\\-3&3\end{pmatrix}}

作为两个初等行变换矩阵的乘积。

解答

从单位矩阵生成这个矩阵的一种方法是使用列运算，首先将第二列乘以三，然后将结果的第二列的负值加到第一列。

{\begin{pmatrix}1&0\\0&1\end{pmatrix}}\;{\xrightarrow[{}]{}}\;{\begin{pmatrix}1&0\\0&3\end{pmatrix}}\;{\xrightarrow[{}]{}}\;{\begin{pmatrix}1&0\\-3&3\end{pmatrix}}

列运算（与行运算相反）是从左到右写的，因此执行上述两个运算用这个矩阵乘积表示。

{\begin{pmatrix}1&0\\0&3\end{pmatrix}}{\begin{pmatrix}1&0\\-1&1\end{pmatrix}}

备注： 或者，我们可以通过行操作获得所需的矩阵。从单位矩阵开始，首先将第一行的负数加到第二行，然后将第二行乘以3，即可。由于连续的行操作被写成从右到左的矩阵乘积，因此进行这两个行操作用以下表达式表示：相同的矩阵乘积。

建议所有读者完成此练习。

问题 13

证明如果 $G$ 有一行零，那么 $GH$ （如果定义）有一行零。这对列有效吗？

解答

$GH$ 的第 $i$ 行由 $G$ 的第 $i$ 行与 $H$ 的列的点积组成。零行与列的点积为零。

如果陈述正确，它对列也适用：如果 $H$ 有一列零，那么 $GH$ （如果定义）有一列零。证明很简单。

问题 14

证明单位矩阵的集合构成 ${\mathcal {M}}_{n\!\times \!m}$ 的基。

解答

也许最简单的方法是证明每个 $n\!\times \!m$ 矩阵都是单位矩阵的线性组合，而且只有一种方式

c_{1}{\begin{pmatrix}1&0&\ldots \\0&0\\\vdots \end{pmatrix}}+\dots +c_{n,m}{\begin{pmatrix}0&0&\ldots \\\vdots \\0&\ldots &&1\end{pmatrix}}={\begin{pmatrix}a_{1,1}&a_{1,2}&\ldots \\\vdots \\a_{n,1}&\ldots &&a_{n,m}\end{pmatrix}}

有唯一解 $c_{1}=a_{1,1}$ ， $c_{2}=a_{1,2}$ ，等等。

问题 15

找出该矩阵的 $n$ 次方公式。

{\begin{pmatrix}1&1\\1&0\end{pmatrix}}

解答

将该矩阵称为 $F$ 。我们有

F^{2}={\begin{pmatrix}2&1\\1&1\end{pmatrix}}\quad F^{3}={\begin{pmatrix}3&2\\2&1\end{pmatrix}}\quad F^{4}={\begin{pmatrix}5&3\\3&2\end{pmatrix}}

一般来说，

F^{n}={\begin{pmatrix}f_{n+1}&f_{n}\\f_{n}&f_{n-1}\end{pmatrix}}

其中 $f_{i}$ 是第 $i$ 个斐波那契数 $f_{i}=f_{i-1}+f_{i-2}$ ，并且 $f_{0}=0$ ， $f_{1}=1$ ，可以通过基于此方程的归纳法来验证。

{\begin{pmatrix}f_{i-1}&f_{i-2}\\f_{i-2}&f_{i-3}\end{pmatrix}}{\begin{pmatrix}1&1\\1&0\end{pmatrix}}={\begin{pmatrix}f_{i}&f_{i-1}\\f_{i-1}&f_{i-2}\end{pmatrix}}

建议所有读者完成此练习。

问题 16

方阵的迹是其对角线上元素的总和（其重要性将在第五章中出现）。证明 ${\text{trace}}\,(GH)={\text{trace}}\,(HG)$ .

解答

第五章给出了一个不太依赖计算的原因——矩阵的迹是其特征多项式的第二项系数——但现在我们可以使用索引。我们有

{\begin{array}{rl}{\text{trace}}\,(GH)&=(g_{1,1}h_{1,1}+g_{1,2}h_{2,1}+\dots +g_{1,n}h_{n,1})\\&\quad +(g_{2,1}h_{1,2}+g_{2,2}h_{2,2}+\dots +g_{2,n}h_{n,2})\\&\quad +\cdots +(g_{n,1}h_{1,n}+g_{n,2}h_{2,n}+\dots +g_{n,n}h_{n,n})\end{array}}

而

{\begin{array}{rl}{\text{trace}}\,(HG)&=(h_{1,1}g_{1,1}+h_{1,2}g_{2,1}+\dots +h_{1,n}g_{n,1})\\&\quad +(h_{2,1}g_{1,2}+h_{2,2}g_{2,2}+\dots +h_{2,n}g_{n,2})\\&\quad +\cdots +(h_{n,1}g_{1,n}+h_{n,2}g_{2,n}+\dots +h_{n,n}g_{n,n})\end{array}}

两者相等。

建议所有读者完成此练习。

问题 17

如果方阵中非零元素仅位于对角线上方或对角线上，则称该方阵为上三角矩阵。证明两个上三角矩阵的乘积为上三角矩阵。这对于下三角矩阵是否也成立？

解答

如果且仅当矩阵的 $i,j$ 项在 $i>j$ 时为零时，矩阵为上三角矩阵。因此，如果 $G,H$ 为上三角矩阵，则 $h_{i,j}$ 和 $g_{i,j}$ 在 $i>j$ 时为零。乘积中的一项 $p_{i,j}=g_{i,1}h_{1,j}+\dots +g_{i,n}h_{n,j}$ 为零，除非至少某些项非零，也就是说，除非对于至少某些求和项 $g_{i,r}h_{r,j}$ ， $i\leq r$ 且 $r\leq j$ 。当然，如果 $i>j$ ，这种情况不会发生，因此两个上三角矩阵的乘积为上三角矩阵。（类似的论证适用于下三角矩阵。）

问题 18

如果方阵中每个元素都介于零和一之间，并且每行的总和为一，则该方阵为马尔可夫矩阵。证明马尔可夫矩阵的乘积也是马尔可夫矩阵。

解答

乘积中第 $i$ 行的总和为：

{\begin{array}{rl}p_{i,1}+\cdots +p_{i,n}&=(h_{i,1}g_{1,1}+h_{i,2}g_{2,1}+\dots +h_{i,n}g_{n,1})\\&\quad +(h_{i,1}g_{1,2}+h_{i,2}g_{2,2}+\dots +h_{i,n}g_{n,2})\\&\quad +\dots +(h_{i,1}g_{1,n}+h_{i,2}g_{2,n}+\dots +h_{i,n}g_{n,n})\\&=h_{i,1}(g_{1,1}+g_{1,2}+\dots +g_{1,n})\\&\quad +h_{i,2}(g_{2,1}+g_{2,2}+\dots +g_{2,n})\\&\quad +\dots +h_{i,n}(g_{n,1}+g_{n,2}+\dots +g_{n,n})\\&=h_{i,1}\cdot 1+\dots +h_{i,n}\cdot 1\\&=1\end{array}}

建议所有读者完成此练习。

问题 19

给出两个秩相同的矩阵的例子，它们的平方具有不同的秩。

解答

表示（例如，关于 ${\mathcal {E}}_{2},{\mathcal {E}}_{2}\subset \mathbb {R} ^{2}$ ) 的映射发送

{\vec {\beta }}_{1}{\stackrel {h}{\longmapsto }}{\vec {\beta }}_{1}\quad {\vec {\beta }}_{2}{\stackrel {h}{\longmapsto }}{\vec {0}}

和

{\vec {\beta }}_{1}{\stackrel {g}{\longmapsto }}{\vec {\beta }}_{2}\quad {\vec {\beta }}_{2}{\stackrel {g}{\longmapsto }}{\vec {0}}

就可以了。

问题 20

将单位矩阵的两个推广结合起来，一个是允许条目不为 1，另一个是允许每行和每列中唯一的 1 偏离对角线。这种矩阵的作用是什么？

解答

该组合是让矩阵的所有条目都为零，除了每一行和每一列中可能有一个非零条目。这样的矩阵可以写成置换矩阵和对角矩阵的乘积，例如：

{\begin{pmatrix}0&4&0\\2&0&0\\0&0&-5\end{pmatrix}}={\begin{pmatrix}0&1&0\\1&0&0\\0&0&1\end{pmatrix}}{\begin{pmatrix}4&0&0\\0&2&0\\0&0&-5\end{pmatrix}}

因此，它的作用是重新缩放行并排列它们。

问题 21

在计算机中，乘法运算比加法运算成本更高，因此人们对减少计算矩阵乘积所需的乘法次数很感兴趣。

我们给出的 $m\!\times \!r$ 矩阵和 $r\!\times \!n$ 矩阵乘积公式需要多少次实数乘法？
矩阵乘法是结合的，因此所有结合方式都会产生相同的结果。然而，乘法次数的成本会有所不同。找到需要最少实数乘法来计算 $5\!\times \!10$ 矩阵、 $10\!\times \!20$ 矩阵、 $20\!\times \!5$ 矩阵和 $5\!\times \!1$ 矩阵的矩阵乘积的结合方式。
（非常难。）找到一种方法，仅使用七次乘法而不是朴素方法建议的八次乘法来乘以两个 $2\!\times \!2$ 矩阵。

解答

每个条目 $p_{i,j}=g_{i,1}h_{1,j}+\dots +g_{1,r}h_{r,1}$ 需要 $r$ 次乘法，并且有 $m\cdot n$ 个条目。因此有 $m\cdot n\cdot r$ 次乘法。
令 $H_{1}$ 为 $5\!\times \!10$ ，令 $H_{2}$ 为 $10\!\times \!20$ ，令 $H_{3}$ 为 $20\!\times \!5$ ，令 $H_{4}$ 为 $5\!\times \!1$ 。然后，使用之前部分中的公式，
${\begin{array}{l|l}{\textit {this\ association}}&{\textit {uses\ this\ many\ multiplications}}\\\hline ((H_{1}H_{2})H_{3})H_{4}&1000+500+25=1525\\(H_{1}(H_{2}H_{3}))H_{4}&1000+250+25=1275\\(H_{1}H_{2})(H_{3}H_{4})&1000+100+100=1200\\H_{1}(H_{2}(H_{3}H_{4}))&100+200+50=350\\H_{1}((H_{2}H_{3})H_{4})&1000+50+50=1100\end{array}}$

显示了哪种方式最便宜。
Knuth 将其归功于 S. Winograd 对 V. Strassen 公式的改进：其中 $w=aA-(a-c-d)(A-C+D)$ ，
${\begin{pmatrix}a&b\\c&d\end{pmatrix}}{\begin{pmatrix}A&B\\C&D\end{pmatrix}}$
$={\begin{pmatrix}aA+bB&w+(c+d)(C-A)+(a+b-c-d)D\\w+(a-c)(D-C)-d(A-B-C+D)&w+(a-c)(D-C)+(c+d)(C-A)\end{pmatrix}}$
需要七次乘法和十五次加法（保存中间结果）。

? 问题 22

如果 $A$ 和 $B$ 是相同大小的方阵，使得 $ABAB=0$ ，那么是否可以推出 $BABA=0$ ？（普特南考试 1990）

解答

以下是引述来源中的答案。

不，推不出。令 $A$ 和 $B$ 分别表示 $\mathbb {R} ^{3}$ 的这些变换，它们关于标准基。

{\begin{pmatrix}x\\y\\z\end{pmatrix}}{\stackrel {a}{\longmapsto }}{\begin{pmatrix}x\\y\\0\end{pmatrix}}\qquad {\begin{pmatrix}x\\y\\z\end{pmatrix}}{\stackrel {a}{\longmapsto }}{\begin{pmatrix}0\\x\\y\end{pmatrix}}

观察到

{\begin{pmatrix}x\\y\\z\end{pmatrix}}{\stackrel {abab}{\longmapsto }}{\begin{pmatrix}0\\0\\0\end{pmatrix}}\quad {\text{but}}\quad {\begin{pmatrix}x\\y\\z\end{pmatrix}}{\stackrel {baba}{\longmapsto }}{\begin{pmatrix}0\\0\\x\end{pmatrix}}.

问题 23

证明这四个断言，以获得行列秩相等的另一种证明。（Liebeck 1966）

${\vec {y}}\cdot {\vec {y}}={\vec {0}}$ 当且仅当 ${\vec {y}}={\vec {0}}$ .
$A{\vec {x}}={\vec {0}}$ 当且仅当 ${{A}^{\rm {trans}}}A{\vec {x}}={\vec {0}}$ .
$\dim({\mathcal {R}}(A))=\dim({\mathcal {R}}({{A}^{\rm {trans}}}A))$ .
${\text{col rank}}(A)={\text{col rank}}({{A}^{\rm {trans}}})={\text{row rank}}(A)$ .

解答

以下是引述来源中的答案。

显而易见。
如果 ${{A}^{\rm {trans}}}A{\vec {x}}={\vec {0}}$ ，那么 ${\vec {y}}\cdot {\vec {y}}=0$ ，其中 ${\vec {y}}=A{\vec {x}}$ 。因此根据(a)， ${\vec {y}}={\vec {0}}$ 。反之亦然。
根据 (b)， $A{\vec {x}}_{1}$ ，... ， $A{\vec {x}}_{n}$ 线性无关当且仅当 ${{A}^{\rm {trans}}}A{\vec {x}}_{1}$ ，... ， ${{A}^{\rm {trans}}}A{\vec {v}}_{n}$ 线性无关。
我们有 ${\text{col rank}}(A)={\text{col rank}}({{A}^{\rm {trans}}}A)=\dim\{{{A}^{\rm {trans}}}(A{\vec {x}})\,{\big |}\,{\text{all }}{\vec {x}}\}\leq \dim\{{{A}^{\rm {trans}}}{\vec {y}}\,{\big |}\,{\text{all }}{\vec {y}}\}={\text{col rank}}({{A}^{\rm {trans}}})$ 。因此也有 ${\text{col rank}}({{A}^{\rm {trans}}})\leq {\text{col rank}}({{{A}^{\rm {trans}}}^{\rm {trans}}})$ 因此我们有 ${\text{col rank}}(A)={\text{col rank}}({{A}^{\rm {trans}}})={\text{row rank}}(A)$ .