建议所有读者完成此练习。
建议所有读者完成此练习。
建议所有读者完成此练习。
问题 3
此表列出了每个工人完成的每种类型的工作的小时数以及相关的工资率。使用矩阵计算应付的工资。
正常工作
加班
艾伦 40 12
贝蒂 35 6
凯瑟琳 40 18
唐纳德 28 0
(备注。 这与上一个问题一样,说明在实践中,我们经常希望在实际上并不关心任何相关的线性映射的情况下,计算行和列的线性组合。)
解答
应付给每个人的工资出现在两个数组的矩阵乘积中。
建议所有读者完成此练习。
问题 5
证明对角矩阵构成 M n × n {\displaystyle {\mathcal {M}}_{n\!\times \!n}} 的子空间。它的维数是多少?
解答
对角矩阵的集合非空,因为零矩阵是对角矩阵。显然它在标量倍数和和下封闭。因此,它是一个子空间。维数是 n {\displaystyle n} ;这里有一个基。
{ ( 1 0 … 0 0 ⋱ 0 0 0 ) , … , ( 0 0 … 0 0 ⋱ 0 0 1 ) } {\displaystyle \{{\begin{pmatrix}1&0&\ldots \\0&0\\&&\ddots \\0&0&&0\end{pmatrix}},\ldots ,{\begin{pmatrix}0&0&\ldots \\0&0\\&&\ddots \\0&0&&1\end{pmatrix}}\}}
问题 8
证明或反驳:非奇异矩阵可交换。
解答
这是错误的;这两个矩阵不可交换。
( 1 0 0 0 ) ( 0 0 1 0 ) {\displaystyle {\begin{pmatrix}1&0\\0&0\end{pmatrix}}\qquad {\begin{pmatrix}0&0\\1&0\end{pmatrix}}}
建议所有读者完成此练习。
问题 12
写
( 1 0 − 3 3 ) {\displaystyle {\begin{pmatrix}1&0\\-3&3\end{pmatrix}}}
作为两个初等行变换矩阵的乘积。
解答
从单位矩阵生成这个矩阵的一种方法是使用列运算,首先将第二列乘以三,然后将结果的第二列的负值加到第一列。
( 1 0 0 1 ) → ( 1 0 0 3 ) → ( 1 0 − 3 3 ) {\displaystyle {\begin{pmatrix}1&0\\0&1\end{pmatrix}}\;{\xrightarrow[{}]{}}\;{\begin{pmatrix}1&0\\0&3\end{pmatrix}}\;{\xrightarrow[{}]{}}\;{\begin{pmatrix}1&0\\-3&3\end{pmatrix}}}
列运算(与行运算相反)是从左到右写的,因此执行上述两个运算用这个矩阵乘积表示。
( 1 0 0 3 ) ( 1 0 − 1 1 ) {\displaystyle {\begin{pmatrix}1&0\\0&3\end{pmatrix}}{\begin{pmatrix}1&0\\-1&1\end{pmatrix}}}
备注: 或者,我们可以通过行操作获得所需的矩阵。从单位矩阵开始,首先将第一行的负数加到第二行,然后将第二行乘以3,即可。由于连续的行操作被写成从右到左的矩阵乘积,因此进行这两个行操作用以下表达式表示:相同的矩阵乘积。
建议所有读者完成此练习。
问题 14
证明单位矩阵的集合构成 M n × m {\displaystyle {\mathcal {M}}_{n\!\times \!m}} 的基。
解答
也许最简单的方法是证明每个 n × m {\displaystyle n\!\times \!m} 矩阵都是单位矩阵的线性组合,而且只有一种方式
c 1 ( 1 0 … 0 0 ⋮ ) + ⋯ + c n , m ( 0 0 … ⋮ 0 … 1 ) = ( a 1 , 1 a 1 , 2 … ⋮ a n , 1 … a n , m ) {\displaystyle c_{1}{\begin{pmatrix}1&0&\ldots \\0&0\\\vdots \end{pmatrix}}+\dots +c_{n,m}{\begin{pmatrix}0&0&\ldots \\\vdots \\0&\ldots &&1\end{pmatrix}}={\begin{pmatrix}a_{1,1}&a_{1,2}&\ldots \\\vdots \\a_{n,1}&\ldots &&a_{n,m}\end{pmatrix}}}
有唯一解 c 1 = a 1 , 1 {\displaystyle c_{1}=a_{1,1}} , c 2 = a 1 , 2 {\displaystyle c_{2}=a_{1,2}} ,等等。
建议所有读者完成此练习。
问题 16
方阵的迹 是其对角线上元素的总和(其重要性将在第五章中出现)。证明 trace ( G H ) = trace ( H G ) {\displaystyle {\text{trace}}\,(GH)={\text{trace}}\,(HG)} .
解答
第五章给出了一个不太依赖计算的原因——矩阵的迹是其特征多项式的第二项系数——但现在我们可以使用索引。 我们有
trace ( G H ) = ( g 1 , 1 h 1 , 1 + g 1 , 2 h 2 , 1 + ⋯ + g 1 , n h n , 1 ) + ( g 2 , 1 h 1 , 2 + g 2 , 2 h 2 , 2 + ⋯ + g 2 , n h n , 2 ) + ⋯ + ( g n , 1 h 1 , n + g n , 2 h 2 , n + ⋯ + g n , n h n , n ) {\displaystyle {\begin{array}{rl}{\text{trace}}\,(GH)&=(g_{1,1}h_{1,1}+g_{1,2}h_{2,1}+\dots +g_{1,n}h_{n,1})\\&\quad +(g_{2,1}h_{1,2}+g_{2,2}h_{2,2}+\dots +g_{2,n}h_{n,2})\\&\quad +\cdots +(g_{n,1}h_{1,n}+g_{n,2}h_{2,n}+\dots +g_{n,n}h_{n,n})\end{array}}}
而
trace ( H G ) = ( h 1 , 1 g 1 , 1 + h 1 , 2 g 2 , 1 + ⋯ + h 1 , n g n , 1 ) + ( h 2 , 1 g 1 , 2 + h 2 , 2 g 2 , 2 + ⋯ + h 2 , n g n , 2 ) + ⋯ + ( h n , 1 g 1 , n + h n , 2 g 2 , n + ⋯ + h n , n g n , n ) {\displaystyle {\begin{array}{rl}{\text{trace}}\,(HG)&=(h_{1,1}g_{1,1}+h_{1,2}g_{2,1}+\dots +h_{1,n}g_{n,1})\\&\quad +(h_{2,1}g_{1,2}+h_{2,2}g_{2,2}+\dots +h_{2,n}g_{n,2})\\&\quad +\cdots +(h_{n,1}g_{1,n}+h_{n,2}g_{2,n}+\dots +h_{n,n}g_{n,n})\end{array}}}
两者相等。
建议所有读者完成此练习。
问题 17
如果方阵中非零元素仅位于对角线上方或对角线上,则称该方阵为上三角矩阵 。证明两个上三角矩阵的乘积为上三角矩阵。这对于下三角矩阵是否也成立?
解答
如果且仅当矩阵的 i , j {\displaystyle i,j} 项在 i > j {\displaystyle i>j} 时为零时,矩阵为上三角矩阵。因此,如果 G , H {\displaystyle G,H} 为上三角矩阵,则 h i , j {\displaystyle h_{i,j}} 和 g i , j {\displaystyle g_{i,j}} 在 i > j {\displaystyle i>j} 时为零。乘积中的一项 p i , j = g i , 1 h 1 , j + ⋯ + g i , n h n , j {\displaystyle p_{i,j}=g_{i,1}h_{1,j}+\dots +g_{i,n}h_{n,j}} 为零,除非至少某些项非零,也就是说,除非对于至少某些求和项 g i , r h r , j {\displaystyle g_{i,r}h_{r,j}} , i ≤ r {\displaystyle i\leq r} 且 r ≤ j {\displaystyle r\leq j} 。当然,如果 i > j {\displaystyle i>j} ,这种情况不会发生,因此两个上三角矩阵的乘积为上三角矩阵。(类似的论证适用于下三角矩阵。)
问题 18
如果方阵中每个元素都介于零和一之间,并且每行的总和为一,则该方阵为马尔可夫矩阵 。证明马尔可夫矩阵的乘积也是马尔可夫矩阵。
解答
乘积中第 i {\displaystyle i} 行的总和为:
p i , 1 + ⋯ + p i , n = ( h i , 1 g 1 , 1 + h i , 2 g 2 , 1 + ⋯ + h i , n g n , 1 ) + ( h i , 1 g 1 , 2 + h i , 2 g 2 , 2 + ⋯ + h i , n g n , 2 ) + ⋯ + ( h i , 1 g 1 , n + h i , 2 g 2 , n + ⋯ + h i , n g n , n ) = h i , 1 ( g 1 , 1 + g 1 , 2 + ⋯ + g 1 , n ) + h i , 2 ( g 2 , 1 + g 2 , 2 + ⋯ + g 2 , n ) + ⋯ + h i , n ( g n , 1 + g n , 2 + ⋯ + g n , n ) = h i , 1 ⋅ 1 + ⋯ + h i , n ⋅ 1 = 1 {\displaystyle {\begin{array}{rl}p_{i,1}+\cdots +p_{i,n}&=(h_{i,1}g_{1,1}+h_{i,2}g_{2,1}+\dots +h_{i,n}g_{n,1})\\&\quad +(h_{i,1}g_{1,2}+h_{i,2}g_{2,2}+\dots +h_{i,n}g_{n,2})\\&\quad +\dots +(h_{i,1}g_{1,n}+h_{i,2}g_{2,n}+\dots +h_{i,n}g_{n,n})\\&=h_{i,1}(g_{1,1}+g_{1,2}+\dots +g_{1,n})\\&\quad +h_{i,2}(g_{2,1}+g_{2,2}+\dots +g_{2,n})\\&\quad +\dots +h_{i,n}(g_{n,1}+g_{n,2}+\dots +g_{n,n})\\&=h_{i,1}\cdot 1+\dots +h_{i,n}\cdot 1\\&=1\end{array}}}
建议所有读者完成此练习。
问题 19
给出两个秩相同的矩阵的例子,它们的平方具有不同的秩。
解答
表示(例如,关于 E 2 , E 2 ⊂ R 2 {\displaystyle {\mathcal {E}}_{2},{\mathcal {E}}_{2}\subset \mathbb {R} ^{2}} ) 的映射发送
β → 1 ⟼ h β → 1 β → 2 ⟼ h 0 → {\displaystyle {\vec {\beta }}_{1}{\stackrel {h}{\longmapsto }}{\vec {\beta }}_{1}\quad {\vec {\beta }}_{2}{\stackrel {h}{\longmapsto }}{\vec {0}}}
和
β → 1 ⟼ g β → 2 β → 2 ⟼ g 0 → {\displaystyle {\vec {\beta }}_{1}{\stackrel {g}{\longmapsto }}{\vec {\beta }}_{2}\quad {\vec {\beta }}_{2}{\stackrel {g}{\longmapsto }}{\vec {0}}}
就可以了。
问题 20
将单位矩阵的两个推广结合起来,一个是允许条目不为 1,另一个是允许每行和每列中唯一的 1 偏离对角线。这种矩阵的作用是什么?
解答
该组合是让矩阵的所有条目都为零,除了每一行和每一列中可能有一个非零条目。这样的矩阵可以写成置换矩阵和对角矩阵的乘积,例如:
( 0 4 0 2 0 0 0 0 − 5 ) = ( 0 1 0 1 0 0 0 0 1 ) ( 4 0 0 0 2 0 0 0 − 5 ) {\displaystyle {\begin{pmatrix}0&4&0\\2&0&0\\0&0&-5\end{pmatrix}}={\begin{pmatrix}0&1&0\\1&0&0\\0&0&1\end{pmatrix}}{\begin{pmatrix}4&0&0\\0&2&0\\0&0&-5\end{pmatrix}}}
因此,它的作用是重新缩放行并排列它们。
问题 21
在计算机中,乘法运算比加法运算成本更高,因此人们对减少计算矩阵乘积所需的乘法次数很感兴趣。
我们给出的 m × r {\displaystyle m\!\times \!r} 矩阵和 r × n {\displaystyle r\!\times \!n} 矩阵乘积公式需要多少次实数乘法? 矩阵乘法是结合的,因此所有结合方式都会产生相同的结果。然而,乘法次数的成本会有所不同。找到需要最少实数乘法来计算 5 × 10 {\displaystyle 5\!\times \!10} 矩阵、 10 × 20 {\displaystyle 10\!\times \!20} 矩阵、 20 × 5 {\displaystyle 20\!\times \!5} 矩阵和 5 × 1 {\displaystyle 5\!\times \!1} 矩阵的矩阵乘积的结合方式。 (非常难。) 找到一种方法,仅使用七次乘法而不是朴素方法建议的八次乘法来乘以两个 2 × 2 {\displaystyle 2\!\times \!2} 矩阵。
解答
每个条目 p i , j = g i , 1 h 1 , j + ⋯ + g 1 , r h r , 1 {\displaystyle p_{i,j}=g_{i,1}h_{1,j}+\dots +g_{1,r}h_{r,1}} 需要 r {\displaystyle r} 次乘法,并且有 m ⋅ n {\displaystyle m\cdot n} 个条目。因此有 m ⋅ n ⋅ r {\displaystyle m\cdot n\cdot r} 次乘法。 令 H 1 {\displaystyle H_{1}} 为 5 × 10 {\displaystyle 5\!\times \!10} ,令 H 2 {\displaystyle H_{2}} 为 10 × 20 {\displaystyle 10\!\times \!20} ,令 H 3 {\displaystyle H_{3}} 为 20 × 5 {\displaystyle 20\!\times \!5} ,令 H 4 {\displaystyle H_{4}} 为 5 × 1 {\displaystyle 5\!\times \!1} 。然后,使用之前部分中的公式,
this\ association uses\ this\ many\ multiplications ( ( H 1 H 2 ) H 3 ) H 4 1000 + 500 + 25 = 1525 ( H 1 ( H 2 H 3 ) ) H 4 1000 + 250 + 25 = 1275 ( H 1 H 2 ) ( H 3 H 4 ) 1000 + 100 + 100 = 1200 H 1 ( H 2 ( H 3 H 4 ) ) 100 + 200 + 50 = 350 H 1 ( ( H 2 H 3 ) H 4 ) 1000 + 50 + 50 = 1100 {\displaystyle {\begin{array}{l|l}{\textit {this\ association}}&{\textit {uses\ this\ many\ multiplications}}\\\hline ((H_{1}H_{2})H_{3})H_{4}&1000+500+25=1525\\(H_{1}(H_{2}H_{3}))H_{4}&1000+250+25=1275\\(H_{1}H_{2})(H_{3}H_{4})&1000+100+100=1200\\H_{1}(H_{2}(H_{3}H_{4}))&100+200+50=350\\H_{1}((H_{2}H_{3})H_{4})&1000+50+50=1100\end{array}}}
显示了哪种方式最便宜。
Knuth 将其归功于 S. Winograd 对 V. Strassen 公式的改进:其中 w = a A − ( a − c − d ) ( A − C + D ) {\displaystyle w=aA-(a-c-d)(A-C+D)} , ( a b c d ) ( A B C D ) {\displaystyle {\begin{pmatrix}a&b\\c&d\end{pmatrix}}{\begin{pmatrix}A&B\\C&D\end{pmatrix}}}
= ( a A + b B w + ( c + d ) ( C − A ) + ( a + b − c − d ) D w + ( a − c ) ( D − C ) − d ( A − B − C + D ) w + ( a − c ) ( D − C ) + ( c + d ) ( C − A ) ) {\displaystyle ={\begin{pmatrix}aA+bB&w+(c+d)(C-A)+(a+b-c-d)D\\w+(a-c)(D-C)-d(A-B-C+D)&w+(a-c)(D-C)+(c+d)(C-A)\end{pmatrix}}} 需要七次乘法和十五次加法(保存中间结果)。
问题 24
证明(其中 A {\displaystyle A} 是一个 n × n {\displaystyle n\!\times \!n} 矩阵,因此定义了任何 n {\displaystyle n} 维空间 V {\displaystyle V} 相对于 B , B {\displaystyle B,B} 的变换,其中 B {\displaystyle B} 是一个基底), dim ( R ( A ) ∩ N ( A ) ) = dim ( R ( A ) ) − dim ( R
N ( A ) ⊂ R ( A ) {\displaystyle {\mathcal {N}}(A)\subset {\mathcal {R}}(A)} 当且仅当 dim ( N ( A ) ) = dim ( R ( A ) ) − dim ( R ( A 2 ) ) {\displaystyle \dim({\mathcal {N}}(A))=\dim({\mathcal {R}}(A))-\dim({\mathcal {R}}(A^{2}))} ; R ( A ) ⊆ N ( A ) {\displaystyle {\mathcal {R}}(A)\subseteq {\mathcal {N}}(A)} 当且仅当 A 2 = 0 {\displaystyle A^{2}=0} ; R ( A ) = N ( A ) {\displaystyle {\mathcal {R}}(A)={\mathcal {N}}(A)} 当且仅当 A 2 = 0 {\displaystyle A^{2}=0} 且 dim ( N ( A ) ) = dim ( R ( A ) ) {\displaystyle \dim({\mathcal {N}}(A))=\dim({\mathcal {R}}(A))} ; dim ( R ( A ) ∩ N ( A ) ) = 0 {\displaystyle \dim({\mathcal {R}}(A)\cap {\mathcal {N}}(A))=0} 当且仅当 dim ( R ( A ) ) = dim ( R ( A 2 ) ) {\displaystyle \dim({\mathcal {R}}(A))=\dim({\mathcal {R}}(A^{2}))} ; (需要直接和部分,这是可选的。) V = R ( A ) ⊕ N ( A ) {\displaystyle V={\mathcal {R}}(A)\oplus {\mathcal {N}}(A)} 当且仅当 dim ( R ( A ) ) = dim ( R ( A 2 ) ) {\displaystyle \dim({\mathcal {R}}(A))=\dim({\mathcal {R}}(A^{2}))} . (
Ackerson 1955 )
解答
以下是引述来源中的答案。
令 ⟨ z → 1 , … , z → k ⟩ {\displaystyle \langle {\vec {z}}_{1},\dots ,{\vec {z}}_{k}\rangle } 为 R ( A ) ∩ N ( A ) {\displaystyle {\mathcal {R}}(A)\cap {\mathcal {N}}(A)} 的基底( k {\displaystyle k} 可能为 0 {\displaystyle 0} )。令 x → 1 , … , x → k ∈ V {\displaystyle {\vec {x}}_{1},\dots ,{\vec {x}}_{k}\in V} 使得 A x → i = z → i {\displaystyle A{\vec {x}}_{i}={\vec {z}}_{i}} 。注意 { A x → 1 , … , A x → k } {\displaystyle \{A{\vec {x}}_{1},\dots ,A{\vec {x}}_{k}\}} 线性无关,并将它扩展为 R ( A ) {\displaystyle {\mathcal {R}}(A)} 的基底: A x → 1 , … , A x → k , A x → k + 1 , … , A x → r 1 {\displaystyle A{\vec {x}}_{1},\ldots ,A{\vec {x}}_{k},A{\vec {x}}_{k+1},\dots ,A{\vec {x}}_{r_{1}}} 其中 r 1 = dim ( R ( A ) ) {\displaystyle r_{1}=\dim({\mathcal {R}}(A))} .
现在取 x → ∈ V {\displaystyle {\vec {x}}\in V} 。写出
A x → = a 1 ( A x → 1 ) + ⋯ + a r 1 ( A x → r 1 ) {\displaystyle A{\vec {x}}=a_{1}(A{\vec {x}}_{1})+\dots +a_{r_{1}}(A{\vec {x}}_{r_{1}})}
因此
A 2 x → = a 1 ( A 2 x → 1 ) + ⋯ + a r 1 ( A 2 x → r 1 ) . {\displaystyle A^{2}{\vec {x}}=a_{1}(A^{2}{\vec {x}}_{1})+\dots +a_{r_{1}}(A^{2}{\vec {x}}_{r_{1}}).}
但 A x → 1 , … , A x → k ∈ N ( A ) {\displaystyle A{\vec {x}}_{1},\dots ,A{\vec {x}}_{k}\in {\mathcal {N}}(A)} ,因此 A 2 x → 1 = 0 → , … , A 2 x → k = 0 → {\displaystyle A^{2}{\vec {x}}_{1}={\vec {0}},\dots ,A^{2}{\vec {x}}_{k}={\vec {0}}} ,我们现在知道
A 2 x → k + 1 , … , A 2 x → r 1 {\displaystyle A^{2}{\vec {x}}_{k+1},\dots ,A^{2}{\vec {x}}_{r_{1}}}
生成 R ( A 2 ) {\displaystyle {\mathcal {R}}(A^{2})} 。
为了看到 { A 2 x → k + 1 , … , A 2 x → r 1 } {\displaystyle \{A^{2}{\vec {x}}_{k+1},\dots ,A^{2}{\vec {x}}_{r_{1}}\}} 是线性无关的,我们写
b k + 1 A 2 x → k + 1 + ⋯ + b r 1 A 2 x → r 1 = 0 → A [ b k + 1 A x → k + 1 + ⋯ + b r 1 A x → r 1 ] = 0 → {\displaystyle {\begin{array}{rl}b_{k+1}A^{2}{\vec {x}}_{k+1}+\dots +b_{r_{1}}A^{2}{\vec {x}}_{r_{1}}&={\vec {0}}\\A[b_{k+1}A{\vec {x}}_{k+1}+\dots +b_{r_{1}}A{\vec {x}}_{r_{1}}]&={\vec {0}}\end{array}}}
并且,由于 b k + 1 A x → k + 1 + ⋯ + b r 1 A x → r 1 ∈ N ( A ) {\displaystyle b_{k+1}A{\vec {x}}_{k+1}+\dots +b_{r_{1}}A{\vec {x}}_{r_{1}}\in {\mathcal {N}}(A)} 我们得到一个矛盾,除非它是 0 → {\displaystyle {\vec {0}}} (很明显它在 R ( A ) {\displaystyle {\mathcal {R}}(A)} 中,但是 A x → 1 , … , A x → k {\displaystyle A{\vec {x}}_{1},\ldots ,A{\vec {x}}_{k}} 是 R ( A ) ∩ N ( A ) {\displaystyle {\mathcal {R}}(A)\cap {\mathcal {N}}(A)} 的基底)。
因此 dim ( R ( A 2 ) ) = r 1 − k = dim ( R ( A ) ) − dim ( R ( A ) ∩ N ( A ) ) {\displaystyle \dim({\mathcal {R}}(A^{2}))=r_{1}-k=\dim({\mathcal {R}}(A))-\dim({\mathcal {R}}(A)\cap {\mathcal {N}}(A))} .
Ackerson, R. H. (1955), "A Note on Vector Spaces", American Mathematical Monthly , American Mathematical Society, 62 (10): 721 .
Liebeck, Hans. (1966), "A Proof of the Equality of Column Rank and Row Rank of a Matrix", American Mathematical Monthly , American Mathematical Society, 73 (10): 1114 .
威廉·洛厄尔·普特南数学竞赛,问题 A-5,1990 年。