线性代数/主题：正交矩阵

线性代数
← 主题：马尔可夫链	主题：正交矩阵	行列式 →

在《几何原本》中，欧几里得认为如果两个图形具有相同的大小和形状，则它们相同。也就是说，下面的三角形并不相等，因为它们不是同一组点。但它们是全等的——对于欧几里得的目的来说基本上是无法区分的——因为我们可以想象拿起平面，将其滑动并旋转一点，但不要扭曲或拉伸它，然后将其放回去，以将第一个图形叠加在第二个图形上。（欧几里得从未明确说明过这个原理，但他在书中经常使用它 (Casey 1890)。）

在现代术语中，“拿起平面...”意味着考虑从平面到自身的映射。欧几里得只将考虑范围限制在平面上的某些变换，这些变换可能可以滑动或旋转平面，但不能弯曲或拉伸它。因此，我们定义映射 $f:\mathbb {R} ^{2}\to \mathbb {R} ^{2}$ 为保距映射、刚体运动或等距映射，如果对于所有点 $P_{1},P_{2}\in \mathbb {R} ^{2}$ ，从 $f(P_{1})$ 到 $f(P_{2})$ 的距离等于从 $P_{1}$ 到 $P_{2}$ 的距离。我们还定义平面图形为平面中的一组点，我们说两个图形是全等的，如果存在一个保距映射从平面到自身，将一个图形映射到另一个图形上。

许多欧几里得几何中的命题可以很容易地从这些定义推导出。其中一些是：（i）共线性在任何距离保持映射下都是不变的（也就是说，如果 $P_{1}$ ， $P_{2}$ ，和 $P_{3}$ 是共线的，那么 $f(P_{1})$ ， $f(P_{2})$ ，和 $f(P_{3})$ 也是共线的），（ii）介于性在任何距离保持映射下都是不变的（如果 $P_{2}$ 介于 $P_{1}$ 和 $P_{3}$ 之间，那么 $f(P_{2})$ 也介于 $f(P_{1})$ 和 $f(P_{3})$ 之间），（iii）三角形的性质在任何距离保持映射下都是不变的（如果一个图形是三角形，那么该图形的像也是三角形），（iv）圆形的性质在任何距离保持映射下都是不变的。1872年，F. 克莱因提出，欧几里得几何可以被描述为对在这些映射下不变的性质的研究。（这构成了克莱因的埃尔朗根纲领的一部分，该纲领提出了一种组织原则，即每种几何——欧几里得、射影等——都可以描述为对在某个变换群下不变的性质的研究。这里的“群”不仅仅指“集合”，但这超出了我们的讨论范围。）

我们可以使用线性代数来描述平面的距离保持映射。

首先，存在一些不是线性的平面的距离保持变换。一个明显的例子是这个平移。

{\begin{pmatrix}x\\y\end{pmatrix}}\quad \mapsto \quad {\begin{pmatrix}x\\y\end{pmatrix}}+{\begin{pmatrix}1\\0\end{pmatrix}}={\begin{pmatrix}x+1\\y\end{pmatrix}}

然而，此例仅为唯一例，即若 $f$ 为距离保持映射，且将 ${\vec {0}}$ 映射到 ${\vec {v}}_{0}$ ，则映射 ${\vec {v}}\mapsto f({\vec {v}})-{\vec {v}}_{0}$ 是线性的。这将立即从以下陈述得出：距离保持映射 $t$ ，它将 ${\vec {0}}$ 映射到自身，是线性的。为了证明这个等效陈述，令

t({\vec {e}}_{1})={\begin{pmatrix}a\\b\end{pmatrix}}\qquad t({\vec {e}}_{2})={\begin{pmatrix}c\\d\end{pmatrix}}

对于某个 $a,b,c,d\in \mathbb {R}$ 。然后为了证明 $t$ 是线性的，我们可以证明它可以用矩阵表示，也就是说，对于所有 $x,y\in \mathbb {R}$ ， $t$ 以这种方式起作用。

{\vec {v}}={\begin{pmatrix}x\\y\end{pmatrix}}{\stackrel {t}{\longmapsto }}{\begin{pmatrix}ax+cy\\bx+dy\end{pmatrix}}\qquad \qquad (*)

Recall that if we fix three non-collinear points then any point in the plane can be described by giving its distance from those three. So any point ${\vec {v}}$ in the domain is determined by its distance from the three fixed points ${\vec {0}}$ , ${\vec {e}}_{1}$ , and ${\vec {e}}_{2}$ . Similarly, any point $t({\vec {v}})$ in the codomain is determined by its distance from the three fixed points $t({\vec {0}})$ , $t({\vec {e}}_{1})$ , and $t({\vec {e}}_{2})$ (these three are not collinear because, as mentioned above, collinearity is invariant and ${\vec {0}}$ , ${\vec {e}}_{1}$ , and ${\vec {e}}_{2}$ are not collinear). In fact, because $t$ is distance-preserving, we can say more: for the point ${\vec {v}}$ in the plane that is determined by being the distance $d_{0}$ from ${\vec {0}}$ , the distance $d_{1}$ from ${\vec {e}}_{1}$ , and the distance $d_{2}$ from ${\vec {e}}_{2}$ , its image $t({\vec {v}})$ must be the unique point in the codomain that is determined by being $d_{0}$ from $t({\vec {0}})$ , $d_{1}$ from $t({\vec {e}}_{1})$ , and $d_{2}$ from $t({\vec {e}}_{2})$ . Because of the uniqueness, checking that the action in ( $*$ ) works in the $d_{0}$ , $d_{1}$ , and $d_{2}$ cases

{\text{dist}}\,({\begin{pmatrix}x\\y\end{pmatrix}},{\vec {0}})={\text{dist}}\,(t({\begin{pmatrix}x\\y\end{pmatrix}}),t({\vec {0}}))={\text{dist}}\,({\begin{pmatrix}ax+cy\\bx+dy\end{pmatrix}},{\vec {0}})

( $t$ 被假定为将 ${\vec {0}}$ 映射到自身）

{\text{dist}}\,({\begin{pmatrix}x\\y\end{pmatrix}},{\vec {e}}_{1})={\text{dist}}\,(t({\begin{pmatrix}x\\y\end{pmatrix}}),t({\vec {e}}_{1}))={\text{dist}}\,({\begin{pmatrix}ax+cy\\bx+dy\end{pmatrix}},{\begin{pmatrix}a\\b\end{pmatrix}})

以及

{\text{dist}}\,({\begin{pmatrix}x\\y\end{pmatrix}},{\vec {e}}_{2})={\text{dist}}\,(t({\begin{pmatrix}x\\y\end{pmatrix}}),t({\vec {e}}_{2}))={\text{dist}}\,({\begin{pmatrix}ax+cy\\bx+dy\end{pmatrix}},{\begin{pmatrix}c\\d\end{pmatrix}})

足以说明 ( $*$ ) 描述了 $t$ 。这些检查是常规的。

因此，任何保持距离的 $f:\mathbb {R} ^{2}\to \mathbb {R} ^{2}$ 可以写成 $f({\vec {v}})=t({\vec {v}})+{\vec {v}}_{0}$ ，其中 ${\vec {v}}_{0}$ 为常数向量，而 $t$ 为保持距离的线性映射。

并非所有线性映射都能保持距离，例如， ${\vec {v}}\mapsto 2{\vec {v}}$ 不会保持距离。但有一个简洁的表征：平面上的线性变换 $t$ 能保持距离当且仅当 $|t({\vec {e}}_{1})|=|t({\vec {e}}_{2})|=1$ 且 $t({\vec {e}}_{1})$ 与 $t({\vec {e}}_{2})$ 正交。该陈述的“仅当”部分很容易——因为 $t$ 能保持距离，它必须保持向量的长度，因为 $t$ 能保持距离，勾股定理表明它必须保持正交性。对于“如果”部分，只需检查该映射是否保持向量长度，因为这样对于所有 ${\vec {p}}$ 和 ${\vec {q}}$ 之间的距离将保持不变 $|t({\vec {p}}-{\vec {q}}\,)|=|t({\vec {p}})-t({\vec {q}}\,)|=|{\vec {p}}-{\vec {q}}\,|$ 。为了进行该检查，令

{\vec {v}}={\begin{pmatrix}x\\y\end{pmatrix}}\quad t({\vec {e}}_{1})={\begin{pmatrix}a\\b\end{pmatrix}}\quad t({\vec {e}}_{2})={\begin{pmatrix}c\\d\end{pmatrix}}

并且，假设“如果”成立，即 $a^{2}+b^{2}=c^{2}+d^{2}=1$ 且 $ac+bd=0$ ，我们有如下结果。

{\begin{array}{rl}|t({\vec {v}}\,)|^{2}&=(ax+cy)^{2}+(bx+dy)^{2}\\&=a^{2}x^{2}+2acxy+c^{2}y^{2}+b^{2}x^{2}+2bdxy+d^{2}y^{2}\\&=x^{2}(a^{2}+b^{2})+y^{2}(c^{2}+d^{2})+2xy(ac+bd)\\&=x^{2}+y^{2}\\&=|{\vec {v}}\,|^{2}\end{array}}

这个特征的妙处在于，我们可以很容易地识别出相对于标准基表示这种映射的矩阵。这些矩阵的列向量长度为1，并且互相正交。这种矩阵被称为 **正交矩阵** 或 **正规矩阵**（第一个术语通常意味着不仅列向量正交，而且长度为1）。

我们可以利用这种洞察力来限定距离保持映射中可能出现的几何操作。由于 $|t({\vec {v}}\,)|=|{\vec {v}}\,|$ ，任何 ${\vec {v}}$ 都将被 $t$ 映射到以原点为圆心，半径等于 ${\vec {v}}$ 长度的圆周上的某个点。特别地， ${\vec {e}}_{1}$ 和 ${\vec {e}}_{2}$ 被映射到单位圆上。更重要的是，一旦我们将单位向量 ${\vec {e}}_{1}$ 固定为映射到具有分量 $a$ 和 $b$ 的向量，那么如果该图像要垂直于第一个向量，则 ${\vec {e}}_{2}$ 只能映射到两个地方：一个地方是 ${\vec {e}}_{2}$ 保持其位置，从

${\vec {e}}_{1}$

${\rm {Rep}}_{{\mathcal {E}}_{2},{\mathcal {E}}_{2}}(t)={\begin{pmatrix}a&-b\\b&a\end{pmatrix}}$

以及一个将点映射到逆时针方向四分之一圆弧上的变换。

${\rm {Rep}}_{{\mathcal {E}}_{2},{\mathcal {E}}_{2}}(t)={\begin{pmatrix}a&b\\b&-a\end{pmatrix}}$

我们可以用几何方法描述这两种情况。设 $\theta$ 为 $x$ 轴与 ${\vec {e}}_{1}$ 的像之间的角度，按逆时针方向测量。上面的第一个矩阵表示相对于标准基的平面绕原点 $\theta$ 弧度旋转。

${\begin{pmatrix}x\\y\end{pmatrix}}{\stackrel {t}{\longmapsto }}{\begin{pmatrix}x\cos \theta -y\sin \theta \\x\sin \theta +y\cos \theta \end{pmatrix}}$

上面的第二个矩阵表示平面关于经过 ${\vec {e}}_{1}$ 和 $t({\vec {e}}_{1})$ 的角平分线的对称变换。

${\begin{pmatrix}x\\y\end{pmatrix}}{\stackrel {t}{\longmapsto }}{\begin{pmatrix}x\cos \theta +y\sin \theta \\x\sin \theta -y\cos \theta \end{pmatrix}}$

(这张图片展示了 ${\vec {e}}_{1}$ 反射到第一象限，以及 ${\vec {e}}_{2}$ 反射到第四象限。）

再次注意： ${\vec {e}}_{1}$ 和 ${\vec {e}}_{2}$ 之间的角度是逆时针方向，并且在上面的第一个映射中，从 $t({\vec {e}}_{1})$ 到 $t({\vec {e}}_{2})$ 的角度也是逆时针方向，因此角度的方向保持不变。但在第二个映射中，方向发生了反转。如果距离保持映射保持方向，则它为 **直接**；如果它反转方向，则它为 **相反**。

因此，我们已经描述了欧几里得关于全等的学习：它考虑了平面图形在以下组合下保持不变的性质：（i）旋转后平移，或（ii）反射后平移（反射后非平凡平移为 **滑动反射**）。

除了图形的全等之外，在初等几何中遇到的另一个概念是，如果图形在比例变化后全等，则它们是 **相似** 的。这两个三角形是相似的，因为第二个三角形与第一个三角形形状相同，但大小为 $3/2$ 。

从以上工作中，我们得知，如果存在正交矩阵 $T$ 使得一个图形上的点 ${\vec {q}}$ 由点 ${\vec {p}}$ 导出，方法为 ${\vec {q}}=(kT){\vec {v}}+{\vec {p}}_{0}$ ，其中 $k$ 为非零实数，且 ${\vec {p}}_{0}$ 为常数向量。

尽管许多这些想法最初是由欧几里得探索的，但数学是永恒的，它们在今天仍然被广泛应用。上面研究的映射的一个应用是计算机图形学。例如，我们可以通过将立方体旋转的电影帧组合在一起，来制作这个立方体顶视图的动画；这是一种刚体运动。


帧 1	帧 2	帧 3

我们还可以通过制作立方体缩小的电影帧，让立方体看起来像是在远离我们，这将给我们提供相似的图形。


帧 1	帧 2	帧 3

计算机图形学在许多其他方面结合了来自线性代数的技术（参见问题 4）。

因此，以上对距离保持映射的分析既有用又有趣。一本探讨这方面内容的精彩书籍是 (Weyl 1952)。更多关于变换群以及其他方面的内容，可以在任何一本关于现代代数的书籍中找到，例如 (Birkhoff & MacLane 1965)。更多关于克莱因和埃尔朗根纲领的内容，可以在 (Yaglom 1988) 中找到。

练习

问题 1

确定以下每个矩阵是否为正交矩阵。

${\begin{pmatrix}1/{\sqrt {2}}&-1/{\sqrt {2}}\\-1/{\sqrt {2}}&-1/{\sqrt {2}}\end{pmatrix}}$
${\begin{pmatrix}1/{\sqrt {3}}&-1/{\sqrt {3}}\\-1/{\sqrt {3}}&-1/{\sqrt {3}}\end{pmatrix}}$
${\begin{pmatrix}1/{\sqrt {3}}&-{\sqrt {2}}/{\sqrt {3}}\\-{\sqrt {2}}/{\sqrt {3}}&-1/{\sqrt {3}}\end{pmatrix}}$

问题 2

写下每个距离保持映射的公式。

旋转 $\pi /6$ 弧度，然后平移 ${\vec {e}}_{2}$ 的映射。
关于直线 $y=2x$ 反射的映射。
关于 $y=-2x$ 反射，并平移 $1$ 个单位向右和 $1$ 个单位向上的映射。

问题 3

关于距离保持映射同时将零向量映射到自身这一点的证明间接表明，这样的映射是单射且满射的（由 $d_{0}$ ， $d_{1}$ 和 $d_{2}$ 确定的域中的点对应于由这三个点确定的陪域中的点）。因此，任何距离保持映射都有逆映射。证明逆映射也是距离保持映射。
证明平面图形间的全等是一个等价关系。

问题 4

在实践中，距离保持线性变换的矩阵和平移通常组合成一个矩阵。验证这两种计算是否产生相同的首两个分量。

{\begin{pmatrix}a&c\\b&d\end{pmatrix}}{\begin{pmatrix}x\\y\end{pmatrix}}+{\begin{pmatrix}e\\f\end{pmatrix}}\qquad {\begin{pmatrix}a&c&e\\b&d&f\\0&0&1\end{pmatrix}}{\begin{pmatrix}x\\y\\1\end{pmatrix}}

(这些是齐次坐标；参见射影几何主题）。

问题 5

验证本主题第二段描述的性质在距离保持映射下确实是保持不变的。
从你在学习欧几里得几何时所获得的经验中，再给出两个在欧几里得几何中具有兴趣且在距离保持映射下也保持不变的性质。
给出一个在欧几里得几何中不具有兴趣，且在距离保持映射下不保持不变的性质。

解答

参考资料

Birkhoff, Garrett; MacLane, Saunders (1965), 现代代数概论, Macmillan.
Casey, John (1890), 欧几里得原本，第一卷到第六卷和第十一卷 (第九版), Hodges, Figgis, and Co..
Weyl, Hermann (1952), 对称性, 普林斯顿大学出版社.
Yaglom, I. M. (1988), 费利克斯·克莱因和索菲斯·李：19 世纪对称性思想的演变, Birkhäuser {{citation}}: 未知参数 |translater= 被忽略 (帮助).

线性代数
← 主题：马尔可夫链	主题：正交矩阵	行列式 →