对于任何矩阵,奇异值分解 (SVD) 是,其中 是一个 酉矩阵, 是一个 酉矩阵, 是一个 对角矩阵,所有非对角元素均为 0,对角元素均为非负实数。 的对角元素被称为“奇异值”。
例如,考虑剪切变换 。 的奇异值分解是
所有单位长度向量,使得 形成一个半径为 1 的球体,围绕原点。当 应用于该球体时,它将变成一个椭球体。该椭球体的半长轴就是奇异值,它们的方位形成 的列向量。
一个不那么显而易见的事实是奇异值分解总是存在的
本质上,任何线性变换都是一个旋转,然后是沿着每个轴的拉伸或收缩(某些维度被添加或归零),最后是另一个旋转。
下面的证明将证明奇异值分解总是存在的。首先将给出证明的提纲
证明提纲
我们需要证明任意线性变换 是一个旋转:,然后是沿着每个轴的缩放:,最后是另一个旋转:,得到.
如果 的列向量已经是相互正交的,那么第一个旋转就不需要:。 的元素是 的列向量形成的向量的长度, 是一个旋转,它将 的基本基向量旋转到与 的列向量平行。
In most cases however, the columns of are not mutually orthogonal. In this case, the rotation is non-trivial. , so must be chosen so that the columns of are mutually orthogonal. Let . We need to choose orthonormal vectors so that are all mutually orthogonal. This can be done iteratively. Imagine that we have chosen so that when given any vector that is orthogonal to , that is orthogonal to . The effort now switches to finding an orthonormal set of vectors confined to the space of vectors that are perpendicular to such that are mutually orthogonal.
令 为一个酉矩阵,其第一列为 。从 左侧提取 得 ,这将产生一组新的正交向量,这些向量是 的列向量。我们的目标是使 的列向量相互正交,这转化为使 的列向量相互正交,其中 有效地替代了 。 变换为 ,并且与 正交的向量空间变换为由标准基向量 张成的空间。 的第一列是 ,因此它与所有其他列向量正交。
如果 是一个酉矩阵,其中 的第一列是 归一化为单位长度,那么从 的左侧提取 得到 会得到一个矩阵,其第一列与标准基向量 平行。 的第一列与所有其他列正交,因此 的第一列与所有其他列正交,因此 的第一行除了第一列之外,其余都包含 0。
现在可以通过递归地确定,维度降低到 , 被替换为 ,并删除第一行和第一列。 这形成了即将到来的证明的归纳部分。
最后,我们如何知道存在,使得当给定任何与 正交的向量 时, 与 正交?答案是使得 最大化的单位长度 是一个有效的 。
现在我们准备给出完整的证明细节
- 奇异值分解存在性的证明
本证明将使用关于 和 的归纳法进行。
- 基本情况
只有一个行,因此具有形式 ,其中 是一个任意的单位长度向量,而 是一个任意的非负实数。注意,对于任何单行矩阵 , 和 都是存在的。
令 ,,和 ,其中 共同构成一个长度为 1 的互相正交的向量集。 可以通过 Gram-Schmidt 正交化方法确定。很明显:.
- 基本情况
只有一个列,因此具有形式 ,其中 是一个任意的长度为 1 的向量,而 是一个任意的非负实数。请注意,对于任何单列矩阵 , 和 都存在。
令 ,,以及 ,其中 共同构成一组相互正交的单位长度向量。 可以通过格拉姆-施密特正交化来确定。 很明显: 。
- 归纳情况
令 表示 的第 个标准基向量。 令 表示一个 的零矩阵。
在约束条件 下,最大化 。令 为最大化 的单位长度向量,并令 。令 (如果 ,那么 是一个任意的单位长度向量)。
使用格拉姆-施密特正交化,可以确定酉矩阵 和 ,使得 和 的第一列分别为 和 : 和 。 其中 。现在将证明 的第一列和第一行除了 (1,1) 位置的元素为 外,其余元素均为 0:.
。这意味着 的第一列是 。
为了说明 的第一行是 ,我们将证明 的第一列与 的所有其他列正交。这将需要利用以下事实:在约束条件 下, 使 最大化。
令 是一个参数化的单位长度向量。令 。
对约束条件 求导得到
在 处取得最大值,得到
( 和 分别表示复数的实部和虚部。)
令 为任意值。令 。 和 是正交的。
这给出了:。
现在令 ,其中下标外的 是虚数单位。 和 是正交的。
这给出了:。
因此:。
因此, 的第一列与 的所有其他列正交,并且 具有以下形式:。
是一个 矩阵,因此,通过归纳推理,。最后,
其中 ,,和 .