跳转到内容

统计学/数值方法/基础线性代数与格拉姆-施密特正交化

来自维基教科书,开放的书籍,开放的世界

基本上,这里的所有部分都可以在线性代数书中找到。但是,格拉姆-施密特正交化被用于统计算法和解决统计问题。因此,我们将简要介绍理解格拉姆-施密特正交化所需的线性代数理论。

以下子节也包含示例。对于进一步理解,重要的是这里介绍的概念不仅适用于作为实数元组的典型向量,也适用于可以被视为向量的函数。

一个集合 ,在其元素上具有两个运算 ,被称为(或简写为 ),如果满足以下条件

  1. 对于所有 ,有
  2. 对于所有 ,有 (交换律)
  3. 对于所有 ,有 (结合律)
  4. 存在一个独特的元素 ,称为 *零*,使得对于所有 都有
  5. 对于所有 ,存在一个唯一的元素 ,使得
  6. 对于所有 都有
  7. 对于所有 都有 (交换律)
  8. 对于所有 都有 (结合律)
  9. 存在一个唯一的元素 ,称为 *一*,使得对于所有 都有
  10. 对于所有非零 ,存在一个唯一的元素 ,使得
  11. 对于所有 都有 (分配律)

中的元素也被称为 *标量*。

很容易证明,具有众所周知的加法和乘法的实数 是一个域。对于具有加法和乘法的复数,情况也是如此。实际上,很少有其他集合可以满足所有这些条件。

对于统计学,只有实数和复数与加法和乘法很重要。

向量空间

[编辑 | 编辑源代码]

具有两个运算 的集合 称为在 R 上的向量空间,如果满足以下条件:

  1. 对于所有 满足
  2. 对于所有 满足 (交换律)
  3. 对于所有 满足 (结合律)
  4. 存在一个唯一的元素 ,称为原点,使得对于所有 满足
  5. 对于所有 存在一个唯一的元素 ,使得满足
  6. 对于所有 满足
  7. 对于所有 都满足 (结合律)
  8. 对于所有 都满足
  9. 对于所有 和所有 都满足 (对向量加法的分配律)
  10. 对于所有 和所有 都满足 (对标量加法的分配律)

注意,我们在 中使用了相同的符号 来表示不同的运算。 的元素也被称为 _向量_。

示例

  1. 集合 ,其中包含实值向量 ,并定义了逐元素加法 和逐元素乘法 ,是一个关于 的向量空间。
  2. 度数为 的多项式集合 ,其中定义了通常的加法和乘法,是一个关于 的向量空间。

线性组合

[edit | edit source]

如果向量 可以表示为向量 的线性组合,则

其中

示例

  • 的线性组合,因为
  • 的线性组合,因为

向量空间的基

[编辑 | 编辑源代码]

一组向量 称为向量空间 ,如果

1. 对于每个向量 存在标量 使得 2. 的任何子集都不能满足条件 1。

需要注意的是,一个向量空间可以有多个基。

示例

  • 每个向量 可以写成 。因此, 的一个基。
  • 每个 次多项式可以写成 的线性组合,因此构成该向量空间的基。

事实上,对于这两个例子,我们都需要证明条件 2,但很明显它成立。

向量空间的维数

[edit | edit source]

向量空间的维数是指构成基所需要的向量的个数。向量空间有无穷多个基,但维数是唯一确定的。请注意,向量空间可能具有无穷维,例如考虑连续函数空间。

示例

  • 的维数是 3, 的维数是
  • 次多项式的维数是

标量积

[edit | edit source]

映射 称为标量积,如果对于所有 以下成立:

  1. ,其中
  2. ,其中

示例

  • 中,典型的标量积是
  • 是度数为 的多项式向量空间上的标量积。

范数

[edit | edit source]

向量的 *范数* 是一个映射 ,如果满足以下条件:

  1. 对于所有 以及 (正定性)
  2. 对于所有 以及所有
  3. 对于所有 (三角不等式)

示例

  • 中,向量的 范数定义为 .
  • 每个标量积通过 生成一个范数,因此 次多项式的范数。

正交性

[编辑 | 编辑源代码]

如果 ,则称两个向量 彼此正交。在 中,两个向量之间的夹角的余弦可以表示为

.

如果 之间的夹角为 90 度(正交),则余弦为零,因此 .

如果向量集 满足

,则称此向量集为标准正交向量集。.

如果我们考虑一个向量空间的基底 ,那么我们希望有一个正交归一基。为什么呢?

由于我们有一个基底,每个向量 可以表示为 。因此, 的标量积简化为

因此,如果系数已知,标量积的计算就简化为简单的乘法和加法。请记住,对于我们的多项式,我们需要解一个积分!

Gram-Schmidt 正交化

[编辑 | 编辑源代码]

格拉姆-施密特正交化的目标是,对于一组向量 ,找到一组等效的 *标准正交* 向量 ,使得任何可以用 的线性组合表示的向量,也可以用 的线性组合表示。

1. 设置 以及

2. 对于每个 ,设置 以及 。在每一步中,向量 投影到 上,并将结果从 中减去。

考虑区间 上的二次多项式,其标量积为 ,范数为 。我们知道 是这个向量空间的一组基。现在让我们构造一个正交归一基。

步骤 1a:

步骤 1b:

步骤 2a:

步骤 2b:

步骤 3a:

步骤 3b:

可以证明 构成上述内积和范数下的正交规范基。

数值不稳定性

[编辑 | 编辑源代码]

考虑向量 。假设 足够小,以至于在计算机上计算 成立(参见 http://en.wikipedia.org/wiki/Machine_epsilon)。让我们计算在 中,这些向量使用标准内积 和范数 的正交规范基。

步骤 1a.

步骤 1b. ,其中

步骤 2a.

步骤 2b.

步骤 3a.

步骤 3b.

很明显,对于向量

-

-

-

标量积 . 其他所有对也不为零,但它们乘以 ,因此结果接近于零。

修正的 Gram-Schmidt 方法

[编辑 | 编辑源代码]

为了解决这个问题,使用修正的 Gram-Schmidt 算法。

  1. 设置 对于所有
  2. 对于每个 ,计算
    1. 对于每个 计算

不同之处在于,我们首先计算新的 并将其从所有其他 中减去。我们将错误计算的向量应用于所有向量,而不是分别计算每个

示例(重新计算)

[编辑 | 编辑源代码]

步骤 1. , ,

步骤 2a. ,其中

步骤 2b.

步骤 2c.

步骤 3a.

步骤 3b.

步骤 4a.

我们可以很容易地验证 .


探索性投影追踪

[编辑 | 编辑源代码]

在高维数据分析中,我们通常分析数据的投影。这种方法源于 Cramer-Wold 定理,该定理指出,如果我们知道所有一维投影,则多维分布是固定的。另一个定理指出,即使数据的多元分布高度非正态,多元数据的多数(一维)投影也看起来是正态的。

因此,在探索性投影追踪中,我们通过与(标准)正态分布的比较来判断投影的有趣性。如果我们假设一维数据 是标准正态分布的,那么在进行变换 后,其中 是标准正态分布的累积分布函数,那么 在区间 中均匀分布。

因此,有趣的程度可以通过 来衡量,其中 是根据数据估计的密度。如果密度 在区间 中等于 ,则积分变为零,我们发现我们投影的数据服从正态分布。大于零的值表示投影数据的正态分布存在偏差,并且有希望是一个有趣的分布。

用正交多项式展开

[edit | edit source]

是一个具有内积 和范数 的正交多项式集。关于区间 中的密度 ,我们可以得出什么结论?

如果 对于某个最大度数 成立,则有

我们也可以写成 或根据经验,我们得到一个估计量 .

我们描述术语 并为我们的积分得到

因此,使用正交函数集允许我们将积分简化为系数的求和,可以通过将 代入上述公式来从数据中估计。系数 可以提前预先计算。

归一化勒让德多项式

[edit | edit source]

剩下的唯一问题是找到正交多项式集 到达度数 。我们知道 为此空间形成一个基底。我们必须应用 Gram-Schmidt 正交化来找到正交多项式。这在 第一个示例 中已经开始。

得到的多项式称为归一化勒让德多项式。除一个缩放因子外,归一化勒让德多项式与 勒让德多项式 相同。勒让德多项式具有以下形式的递归表达式

因此,计算我们的积分就简化为计算 ,并使用递归关系计算 。请注意,递归可能在数值上不稳定!

参考文献

[编辑 | 编辑源代码]
  • Halmos, P.R. (1974). 有限维向量空间,施普林格:纽约
华夏公益教科书