事实证明,线性变换可以在矩阵中以一对一的方式表示。本章很可能是回顾,因为这个主题可能已经在高中学习过(请参见此链接 )。在对线性变换的研究中,建立线性变换和矩阵之间的一对一对应关系非常重要。
假设您有一个向量空间 X 的一组基向量 x1 、x2 、x3 、...、xm 和一个向量空间 Y 的一组基向量 y1 、y2 、y3 、...、yn 。
考虑从 X 到 Y 的线性变换 T,以及向量
T(x1 )=y1 a11 +y2 a21 +y3 a31 +...+yn an1 , T(x2 )=y1 a12 +y2 a22 +y3 a32 +...+yn an2 , T(x3 )=y1 a13 +y2 a23 +y3 a33 +...+yn an3 ,
... T(xm )=y1 a1m +y2 a2m +y3 a3m +...+yn anm ,
您可以将这些系数排列在一个矩阵中
M = ( a 11 a 12 a 13 … a 1 m a 21 a 22 a 23 … a 2 m a 31 a 32 a 33 … a 3 m ⋮ ⋮ ⋮ ⋮ ⋮ a n 1 a n 2 a n 3 … a n m ) {\displaystyle M={\begin{pmatrix}a_{11}&a_{12}&a_{13}&\ldots &a_{1m}\\a_{21}&a_{22}&a_{23}&\ldots &a_{2m}\\a_{31}&a_{32}&a_{33}&\ldots &a_{3m}\\\vdots &\vdots &\vdots &\vdots &\vdots \\a_{n1}&a_{n2}&a_{n3}&\ldots &a_{nm}\\\end{pmatrix}}} .
因此,如果您有任何向量
x = ∑ j = 1 m x j b j {\displaystyle x=\sum _{j=1}^{m}x_{j}b_{j}} ,
然后
T ( x ) = T ( ∑ j = 1 m x j b j ) = ∑ j = 1 m b j T ( x j ) = ∑ j = 1 m b j ∑ i = 1 n y i a i j = ∑ i = 1 n y i ∑ j = 1 m a i j b j {\displaystyle T(x)=T(\sum _{j=1}^{m}x_{j}b_{j})=\sum _{j=1}^{m}b_{j}T(x_{j})=\sum _{j=1}^{m}b_{j}\sum _{i=1}^{n}y_{i}a_{ij}=\sum _{i=1}^{n}y_{i}\sum _{j=1}^{m}a_{ij}b_{j}}
因此,T(x) 是基向量的线性组合
∑ i = 1 n y n c i {\displaystyle \sum _{i=1}^{n}y_{n}c_{i}} , 其中
c i = ∑ j = 1 m a i j b j {\displaystyle c_{i}=\sum _{j=1}^{m}a_{ij}b_{j}} .
因此,关于基的矩阵的知识可以确定线性变换结果的值。
因此,给定任何矩阵,都有一个对应的函数,其结果为
∑ i = 1 n y n c i {\displaystyle \sum _{i=1}^{n}y_{n}c_{i}} , 其中
c i = ∑ j = 1 m a i j b j {\displaystyle c_{i}=\sum _{j=1}^{m}a_{ij}b_{j}} .
这显然是一个线性算子,其矩阵与使用的矩阵一致。这证实了每个 n×m 矩阵都可以确定一个线性算子,该算子将 m 维向量空间映射到 n 维向量空间。
定义 C=A+B,其中 A 和 B 是线性变换,为函数 C(x)=A(x)+B(x)。可以很容易地验证这也是一个线性变换。您可以验证给定两个线性变换 A 和 B,则
A+B=B+A
(A+B)+C=C+(B+A)
A+0=A
A+(-A)=0
其中 0 是零算子,-A 是函数 -A(x),可以很容易地验证它是一个线性变换。
给定线性变换 a,定义函数 μ A {\displaystyle \mu A} ,其中 μ {\displaystyle \mu } 是域中的元素,为函数 ( μ L ) ( x ) = μ ( L ( x ) ) {\displaystyle (\mu L)(x)=\mu (L(x))} 。
可以很容易地验证,给定线性变换 A 和 B 以及域中的元素 μ {\displaystyle \mu } , μ 1 {\displaystyle \mu _{1}} 和 μ 2 {\displaystyle \mu _{2}} ,则
μ 1 ( μ 2 A ) = ( μ 1 μ 2 ) A {\displaystyle \mu _{1}(\mu _{2}A)=(\mu _{1}\mu _{2})A}
1 A = A {\displaystyle 1A=A}
( μ 1 + μ 2 ) A = μ 1 A + μ 2 A {\displaystyle (\mu _{1}+\mu _{2})A=\mu _{1}A+\mu _{2}A}
μ ( A + B ) = μ A + μ B {\displaystyle \mu (A+B)=\mu A+\mu B}
这意味着线性变换形成一个向量空间。
给定从 X 到 Y 的线性变换 A 和从 Y 到 Z 的线性变换 B,然后定义从 X 到 Z 的函数 AB 为这两个函数的复合。可以很容易地验证这也是一个线性变换。
以下是一些可以很容易地验证的有用关系
μ ( A B ) = ( μ A ) B {\displaystyle \mu (AB)=(\mu A)B}
( A + B ) C = A C + B C {\displaystyle (A+B)C=AC+BC}
C ( A + B ) = C A + C B {\displaystyle C(A+B)=CA+CB}
( A B ) C = A ( B C ) {\displaystyle (AB)C=A(BC)} .
由于从 m 维空间到 n 维空间的线性变换与 m×n 矩阵之间存在一一对应关系,因此加法、标量乘法和乘法运算在其一一对应关系中定义,并且上面列出的所有性质都适用于矩阵。矩阵 M 和 N 的加法可以定义为对应于 m+n 的矩阵,其中 m 和 n 分别对应于 M 和 N 的线性变换。其他操作类似地定义。
设 A = |aij | 和 B = |bij | 是两个 n×m 维矩阵。考虑 **A** 和 **B**,它们是从 m 维向量空间 M 到 n 维向量空间 N 的对应线性变换。设 m1 ,m2 ,m3 ,…,mm 是 M 的基向量,n1 ,n2 ,n3 ,…,nn 是 N 的基向量。然后
A ( m i ) = ∑ j = 1 n a i j n j {\displaystyle A(m_{i})=\sum _{j=1}^{n}a_{ij}n_{j}} , 以及 B ( m i ) = ∑ j = 1 n b i j n j {\displaystyle B(m_{i})=\sum _{j=1}^{n}b_{ij}n_{j}} .
因此
( A + B ) ( m i ) = ∑ j = 1 n ( a i j + b i j ) n j {\displaystyle (A+B)(m_{i})=\sum _{j=1}^{n}(a_{ij}+b_{ij})n_{j}}
因此,该算子的矩阵的元素为 |aij +bij |。换句话说,两个矩阵的和的元素是这两个矩阵对应元素的和。
示例
( 1 3 1 0 1 2 ) + ( 0 0 7 5 2 1 ) = ( 1 + 0 3 + 0 1 + 7 0 + 5 1 + 2 2 + 1 ) = ( 1 3 8 5 3 3 ) {\displaystyle {\begin{pmatrix}1&3\\1&0\\1&2\end{pmatrix}}+{\begin{pmatrix}0&0\\7&5\\2&1\end{pmatrix}}={\begin{pmatrix}1+0&3+0\\1+7&0+5\\1+2&2+1\end{pmatrix}}={\begin{pmatrix}1&3\\8&5\\3&3\end{pmatrix}}}
一旦定义了加法,我们就显然也定义了减法。A - B 通过减去 A 和 B 的对应元素来计算,并且具有与 A 和 B 相同的维度。例如
( 1 3 1 0 1 2 ) − ( 0 0 7 5 2 1 ) = ( 1 − 0 3 − 0 1 − 7 0 − 5 1 − 2 2 − 1 ) = ( 1 3 − 6 − 5 − 1 1 ) {\displaystyle {\begin{pmatrix}1&3\\1&0\\1&2\end{pmatrix}}-{\begin{pmatrix}0&0\\7&5\\2&1\end{pmatrix}}={\begin{pmatrix}1-0&3-0\\1-7&0-5\\1-2&2-1\end{pmatrix}}={\begin{pmatrix}1&3\\-6&-5\\-1&1\end{pmatrix}}}
矩阵的标量乘法定义为对应线性变换的标量乘积的对应矩阵。
考虑一个元素为 |aij | 的矩阵 A 及其从 M 到 N 的对应线性变换A ,以及域中的一个元素 μ {\displaystyle \mu } ,并且设 m1 , m2 , m3 , ..., mm 为 M 的基向量,n1 , n2 , n3 , ..., nn 为 N 的基向量。由于
( μ A ) ( m j ) = ∑ i = 1 m μ a i j n i = μ ∑ i = 1 m a i j n i {\displaystyle (\mu A)(m_{j})=\sum _{i=1}^{m}\mu a_{ij}n_{i}=\mu \sum _{i=1}^{m}a_{ij}n_{i}} ,对应矩阵的元素为 | μ {\displaystyle \mu } aij |。
For example, multiplication by 2 of a matrix:
2 ⋅ ( 1 8 − 3 4 − 2 5 ) = ( 2 ⋅ 1 2 ⋅ 8 2 ⋅ − 3 2 ⋅ 4 2 ⋅ − 2 2 ⋅ 5 ) = ( 2 16 − 6 8 − 4 10 ) {\displaystyle 2\cdot {\begin{pmatrix}1&8&-3\\4&-2&5\end{pmatrix}}={\begin{pmatrix}2\cdot 1&2\cdot 8&2\cdot -3\\2\cdot 4&2\cdot -2&2\cdot 5\end{pmatrix}}={\begin{pmatrix}2&16&-6\\8&-4&10\end{pmatrix}}}
标量乘法具有以下性质,这些性质已经因其与线性变换的一一对应而得到证明
左分配律: (α+β)A = αA+βA。
右分配律: α(A+B) = αA+αB。
结合律: (αβ)A=α(βA)).
1A = A.
0A= 0 .
(-1)A = -A.
如上所述,矩阵乘法也将被定义为其与线性变换的对应关系。两个矩阵的乘积是对应两个线性变换的乘积的对应矩阵。
考虑一个 o 行 n 列的矩阵 A,其元素为 |aij |,一个 n 行 m 列的矩阵 B,其元素为 |bij |,并设 A 是从 n 维 M 到 o 维 O 的线性变换,它对应于 A,设 B 是从 m 维 N 到 n 维 N 的线性变换,它对应于 B,并设 m1 , m2 , m3 , ..., mm , 为 M 的基向量,n1 , n2 , n3 , ..., nn , 为 N 的基向量,o1 , o2 , o3 , ..., oo , 为 O 的基向量。那么
( A B ) ( m i ) = A ( ∑ j = 1 n b j i n j ) = ∑ j = 1 n b j i A ( n j ) = ∑ j = 1 n b j i ∑ k = 1 o a k j o k = ∑ k = 1 o ( ∑ j = 1 n a k j b j i ) o k {\displaystyle (AB)(m_{i})=A(\sum _{j=1}^{n}b_{ji}n_{j})=\sum _{j=1}^{n}b_{ji}A(n_{j})=\sum _{j=1}^{n}b_{ji}\sum _{k=1}^{o}a_{kj}o_{k}=\sum _{k=1}^{o}(\sum _{j=1}^{n}a_{kj}b_{ji})o_{k}}
因此对应矩阵的元素 |pij | 由下式给出
p i j = ∑ k = 1 n a i k b k j {\displaystyle p_{ij}=\sum _{k=1}^{n}a_{ik}b_{kj}}
例如
( 1 0 2 − 1 3 1 ) × ( 3 1 2 1 1 0 ) = ( ( 1 × 3 + 0 × 2 + 2 × 1 ) ( 1 × 1 + 0 × 1 + 2 × 0 ) ( − 1 × 3 + 3 × 2 + 1 × 1 ) ( − 1 × 1 + 3 × 1 + 1 × 0 ) ) {\displaystyle {\begin{pmatrix}1&0&2\\-1&3&1\\\end{pmatrix}}\times {\begin{pmatrix}3&1\\2&1\\1&0\\\end{pmatrix}}={\begin{pmatrix}(1\times 3+0\times 2+2\times 1)&(1\times 1+0\times 1+2\times 0)\\(-1\times 3+3\times 2+1\times 1)&(-1\times 1+3\times 1+1\times 0)\\\end{pmatrix}}}
= ( 5 1 4 2 ) . {\displaystyle ={\begin{pmatrix}5&1\\4&2\\\end{pmatrix}}.}
矩阵乘积
矩阵乘法具有以下性质,这些性质已得到验证,因为它们在线性变换中也是正确的。
结合律: A(BC) = (AB)C.
左分配律: A(B+C) = AB+AC.
右分配律: (A+B)C = AC+BC.
IA = A = AI.
α(BC) = (αB)C = B(αC).
矩阵乘法一般情况下不满足交换律,即存在矩阵,使得 AB ≠ {\displaystyle \neq } BA。一个例子可以由: A = ( 7 8 9 10 11 12 ) {\displaystyle A={\begin{pmatrix}7&8\\9&10\\11&12\end{pmatrix}}} 和 B = ( 1 2 3 4 5 6 ) {\displaystyle B={\begin{pmatrix}1&2&3\\4&5&6\end{pmatrix}}} 给出。
矩阵乘法的定义方式似乎不合理且奇怪;为什么矩阵乘法不能像加法和数乘那样仅仅定义为对应元素相乘?不幸的是,我们只有在第三章才能找到问题的真正答案。在此之前,我们将通过注意到矩阵乘法在矩阵形式 下表示线性方程组所带来的优势来使自己满意。这一点将在下一节中阐明。
在这一点上,我们认为有必要做出另一个定义。n 行 n 列的矩阵 A 为可逆 当且仅当存在矩阵 B 使得
AB = In = BA.
在这种情况下,B 是 A 的逆矩阵 ,用 A−1 表示。显然,单位矩阵的逆矩阵就是它本身。我们将在后面详细研究可逆矩阵。
这里还需要注意一点。当乘积矩阵仅仅是通过将两个相同维数矩阵的对应元素相乘得到的矩阵时,这种类型的矩阵乘法也有一个名称。它被称为哈达玛积 。我们将不使用这种类型的乘法。在整本书中,矩阵乘法将始终指上面定义的矩阵乘积。
此外,行列式在以下意义上是乘法映射
det ( A B ) = det ( A ) det ( B ) {\displaystyle \det(AB)=\det(A)\det(B)\,} 对于所有n ×n 矩阵 A {\displaystyle A} 和 B {\displaystyle B} 。
这由柯西-比内公式 推广到非方阵的乘积。
矩阵的概念在历史上被引入是为了简化线性方程组的求解,尽管它们今天有着更广泛的应用。让我们看看如何用矩阵来表示线性方程组。
考虑一个包含 m 个线性方程和 n 个未知数的一般方程组
a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋮ ⋮ ⋮ ⋮ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m {\displaystyle {\begin{alignedat}{7}a_{11}x_{1}&&\;+\;&&a_{12}x_{2}&&\;+\cdots +\;&&a_{1n}x_{n}&&\;=\;&&&b_{1}\\a_{21}x_{1}&&\;+\;&&a_{22}x_{2}&&\;+\cdots +\;&&a_{2n}x_{n}&&\;=\;&&&b_{2}\\\vdots \;\;\;&&&&\vdots \;\;\;&&&&\vdots \;\;\;&&&&&\;\vdots \\a_{m1}x_{1}&&\;+\;&&a_{m2}x_{2}&&\;+\cdots +\;&&a_{mn}x_{n}&&\;=\;&&&b_{m}\\\end{alignedat}}}
该方程组等价于以下形式的矩阵方程
A x = b {\displaystyle A\mathbf {x} =\mathbf {b} }
其中 A 是一个 m×n 矩阵,x 是一个包含 n 个元素的列矩阵,b 是一个包含 m 个元素的列矩阵。
A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] , x = [ x 1 x 2 ⋮ x n ] , b = [ b 1 b 2 ⋮ b m ] {\displaystyle A={\begin{bmatrix}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{m1}&a_{m2}&\cdots &a_{mn}\end{bmatrix}},\quad \mathbf {x} ={\begin{bmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{bmatrix}},\quad \mathbf {b} ={\begin{bmatrix}b_{1}\\b_{2}\\\vdots \\b_{m}\end{bmatrix}}}
显然,我们定义矩阵乘法的这种方式用于以这种方式表示线性方程组,因为现在矩阵 A 和矩阵 x 的乘积正好给了我们矩阵 b。
用这种方式表示线性方程组,也使我们能够很容易地证明以下定理
定理 1: 任何线性方程组要么无解,要么只有一个解,要么有无数个解。
证明: 假设线性方程组 Ax = b 有两个不同的解,分别为 X 和 Y。然后设 Z = X - Y。显然 Z 不为零,并且 A(X + kZ) = AX + kAZ = b + k(AX - AY) = b + k(b - b) = b,因此对于 k 的所有可能取值,X + kZ 都是该方程组的解。由于 k 可以取无数个值,因此显然我们有无数个解。
许多练习的提示可以在著名数学定理/代数/矩阵理论 中找到。
1. 设 A 和 B 为 m×n 矩阵。那么
(i) ( k A ) T {\displaystyle (kA)^{T}} = k A T {\displaystyle kA^{T}}
(ii) ( A + B ) T = A T + B T {\displaystyle (A+B)^{T}=A^{T}+B^{T}}
(iii) ( A B ) T = B T A T {\displaystyle (AB)^{T}=B^{T}A^{T}}
2. 设一个 _三角矩阵_ 是一个方阵,其中所有 (i,j) 元素要么对于 i<j(在这种情况下称为 _下三角矩阵_)要么对于 j<i(在这种情况下称为 _上三角矩阵_)为零。证明任何满足 A A T = A T A {\displaystyle AA^{T}=A^{T}A} 的三角矩阵都是对角矩阵。
3. 对于一个方阵 A,证明
(i) A A T {\displaystyle AA^{T}} 和 A + A T {\displaystyle A+A^{T}} 是对称的
(ii) A − A T {\displaystyle A-A^{T}} 是反对称的
(iii) A 可以表示为一个对称矩阵 1 2 ( A + A T ) {\displaystyle {\frac {1}{2}}(A+A^{T})} 和一个反对称矩阵 1 2 ( A − A T ) {\displaystyle {\frac {1}{2}}(A-A^{T})} 的和。
4. 假设 A 是一个 m×n 矩阵,x 是一个 n×1 列向量。证明如果 x = ( x 1 x 2 ⋮ x n ) {\displaystyle x={\begin{pmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{pmatrix}}} 且 A = ( c 1 c 2 ⋯ c n ) {\displaystyle A={\begin{pmatrix}c_{1}&c_{2}&\cdots c_{n}\end{pmatrix}}} ,其中 c j = ( A 1 j A 2 j ⋮ A m j ) {\displaystyle c_{j}={\begin{pmatrix}A_{1j}\\A_{2j}\\\vdots \\A_{mj}\end{pmatrix}}} ,那么 A x = x 1 c 1 + x 2 c 2 + ⋯ x n c n {\displaystyle Ax=x_{1}c_{1}+x_{2}c_{2}+\cdots x_{n}c_{n}} 。这也表示为 Ax 是 _A 的列的线性组合_。