目标

定义向量和矩阵
加、减、乘矩阵
求方阵的转置
定义矩阵的逆
将联立线性方程组设置为矩阵形式

资源

向量和矩阵

一个矩阵是一个矩形的数组，例如数字、符号或表达式。矩阵通常用来表示线性变换和线性方程组。

一个三角矩阵是一种特殊的方阵。如果 A 中主对角线以下的所有元素都为零，则 A 称为上三角矩阵。

a_{ij}=0

对所有

i>j

类似地，如果 A 中主对角线以上的所有元素都为零，则 A 称为下三角矩阵。

a_{ij}=0

对所有

i<j

如果主对角线以外的所有元素都为零，则 A 称为对角矩阵。

a_{ij}=0

对所有

i\neq j

这个矩阵

{\begin{bmatrix}1&4&2\\0&3&4\\0&0&1\\\end{bmatrix}}

是上三角，这个矩阵

{\begin{bmatrix}1&0&0\\2&8&0\\4&9&7\\\end{bmatrix}}

是下三角。

大小为 n 的单位矩阵是一个 n×n 矩阵，其中主对角线上的所有元素都等于 1，其他所有元素都等于 0。

矩阵乘法

矩阵乘法接受两个矩阵并生成另一个矩阵。该操作的规则如下所示

{\overset {4\times 2{\text{ matrix}}}{\begin{bmatrix}{\color {Brown}{a_{11}}}&{\color {Brown}{a_{12}}}\\\cdot &\cdot \\{\color {Orange}{a_{31}}}&{\color {Orange}{a_{32}}}\\\cdot &\cdot \\\end{bmatrix}}}{\overset {2\times 3{\text{ matrix}}}{\begin{bmatrix}\cdot &{\color {Plum}{b_{12}}}&{\color {Violet}{b_{13}}}\\\cdot &{\color {Plum}{b_{22}}}&{\color {Violet}{b_{23}}}\\\end{bmatrix}}}={\overset {4\times 3{\text{ matrix}}}{\begin{bmatrix}\cdot &x_{12}&x_{13}\\\cdot &\cdot &\cdot \\\cdot &x_{32}&x_{33}\\\cdot &\cdot &\cdot \\\end{bmatrix}}}

用圆圈标记的交点处的值为

{\begin{aligned}x_{12}&={\color {Brown}{a_{11}}}{\color {Plum}{b_{12}}}+{\color {Brown}{a_{12}}}{\color {Plum}{b_{22}}}\\x_{13}&={\color {Brown}{a_{11}}}{\color {Violet}{b_{13}}}+{\color {Brown}{a_{12}}}{\color {Violet}{b_{23}}}\\x_{32}&={\color {Orange}{a_{31}}}{\color {Plum}{b_{12}}}+{\color {Orange}{a_{32}}}{\color {Plum}{b_{22}}}\\x_{33}&={\color {Orange}{a_{31}}}{\color {Violet}{b_{13}}}+{\color {Orange}{a_{32}}}{\color {Violet}{b_{23}}}\end{aligned}}

矩阵的转置

矩阵的转置定义如下：矩阵A的转置是另一个矩阵A^T，可以通过以下任何一种等效操作创建

沿其主对角线（从左上角到右下角）反射A以获得A^T
将A的行写为A^T的列
将A的列写为A^T的行

下图说明了这个概念

矩阵的逆

如果存在一个n×n方阵B，使得

\mathbf {AB} =\mathbf {BA} =\mathbf {I} _{n}\

其中I_n表示n×n单位矩阵，使用的乘法是普通的矩阵乘法。B被称为A的逆，记为A⁻¹。

将线性方程组表示为矩阵形式

{\begin{alignedat}{7}2x&&\;+\;&&y&&\;-\;&&z&&\;=\;&&8&\qquad (L_{1})\\-3x&&\;-\;&&y&&\;+\;&&2z&&\;=\;&&-11&\qquad (L_{2})\\-2x&&\;+\;&&y&&\;+\;&&2z&&\;=\;&&-3&\qquad (L_{3})\end{alignedat}}

我们可以将这个线性方程组表示成矩阵形式，如下所示

{\begin{bmatrix}2x&+&y&-&z\\-3x&-&y&+&2z\\-2x&+&y&+&2z\end{bmatrix}}={\begin{bmatrix}8\\-11\\-3\end{bmatrix}}

然后我们可以使用矩阵乘法来分离变量。

{\begin{bmatrix}2&1&-1\\-3&-1&2\\-2&1&2\end{bmatrix}}{\begin{bmatrix}x\\y\\z\end{bmatrix}}={\begin{bmatrix}8\\-11\\-3\end{bmatrix}}

{\begin{bmatrix}25&5&1\\64&8&1\\144&12&1\end{bmatrix}}{\begin{bmatrix}a_{1}\\a_{2}\\a_{3}\end{bmatrix}}={\begin{bmatrix}106.8\\177.2\\279.2\end{bmatrix}}

线性方程组的一般矩阵形式如下所示

A_{n\times n}X_{n\times 1}=C_{n\times 1}

矩阵A是系数矩阵。X是解向量（矩阵），C是右侧向量。如果我们在两边乘以A的逆矩阵，我们可以看到解与A的逆矩阵密切相关。

{\begin{alignedat}{3}A^{-1}AX&&\;=\;&&A^{-1}C\\IX&&\;=\;&&A^{-1}C\\X&&\;=\;&&A^{-1}C\end{alignedat}}

高斯消元法

来源

书本章节

高斯消元法是一个用来求解线性方程组的算法，类似于求一个可逆方阵的逆矩阵。该算法包含一系列对系数矩阵进行的行变换操作。共有三种基本行变换：

交换两行
将一行乘以一个非零常数
将一行乘以一个常数加到另一行上。

例如，第一个线性方程 (L₁，主元方程) 可以用来消去 $x$ 从接下来的两个方程中：

{\begin{alignedat}{7}2x&&\;+\;&&y&&\;-\;&&z&&\;=\;&&8&\qquad (L_{1})\\-3x&&\;-\;&&y&&\;+\;&&2z&&\;=\;&&-11&\qquad (L_{2})\\-2x&&\;+\;&&y&&\;+\;&&2z&&\;=\;&&-3&\qquad (L_{3})\end{alignedat}}

然后 L₂ (主元方程) 可以用来消去 $y$ 从 L₃ 中。这个过程被称为**前向消元**。现在 L₃ 中只有一个未知量 $z$ ，可以用来将 $z$ 代入 L₂ 中求解 $y$ 。这个过程被称为**后向代入**。

高斯消元法的算法可以这样实现：

''' 
x = gauss_elimin(a, b)
Solves [a][x] = [b] by Gauss elimination.
'''
from numpy import dot, array

def gauss_elimin(a, b):
  (rows, cols) = a.shape
  # elimination phase
  for row in range(0, rows-1): # pivot equation/row
    for i in range(row+1, rows):
      if a[i, row] != 0.0:
        factor = a[i, row]/a[row, row]
        a[i, row+1:rows] = a[i, row+1:rows] - factor*a[row, row+1:rows]
        b[i] = b[i] - factor*b[row]
  # back substitution 
  for k in range(rows-1,-1,-1):
    b[k] = (b[k] - dot(a[k, k+1:rows],b[k+1:rows]))/a[k, k]
  return b

a = array([[3, 2.0], [-6, 6]])
b = array([7, 6])
print gauss_elimin(a, b)