概率收敛将在本书后面的内容中成为推导渐近分布的一个非常有用的工具。它与分布收敛一起,将是出现频率最高的收敛模式。
如果随机变量序列 概率收敛于 ,则
|
|
|
一个等价的陈述是
|
|
这将写成 或 。
我们将假设这个级数在概率上收敛到退化的随机变量 。所以我们有:
因此,在这种情况下,我们对概率收敛的定义是:
|
|
|
因此,对于 的任何正值,我们总能找到一个足够大的 ,使得我们的定义得到满足。因此,我们证明了 。
几乎必然收敛与概率收敛有着显著的相似性,然而,这种收敛模式的条件更强;正如我们稍后将看到的,几乎必然收敛实际上意味着该序列也以概率收敛。
如果随机变量序列 几乎必然收敛到随机变量 ,则:
|
|
等价地
|
在这些条件下,我们使用符号 或 .
让我们看看概率收敛部分中的例子是否也几乎处处收敛。定义
我们再次猜测收敛于 . 检查得到的结果,我们发现
|
从而满足了我们几乎处处收敛的定义。
分布收敛将通过中心极限定理的使用在我们计量经济学模型中频繁出现。所以让我们定义这种收敛类型。
一个随机变量序列 在分布上渐近收敛到随机变量 ,如果对于所有连续点,。 和 分别是 和 的累积分布函数。
我们这里关心的是随机变量的分布。考虑学生 t 分布:随着自由度 的增加,我们的分布越来越接近高斯分布。因此,随机变量 在分布上收敛到随机变量 (注意,我们说随机变量 作为一种记号上的辅助,我们真正应该使用的是 /
让我们考虑分布 Xn,它的样本空间由两个点组成,1/n 和 1,概率相等(1/2)。令 X 为二项分布,其中 p = 1/2。那么 Xn 在分布上收敛到 X。
证明很简单:我们忽略 0 和 1(X 的分布在这些点上不连续),并证明对于所有其他点 a, 由于对于 a < 0,所有 Fs 都为 0,而对于 a > 1,所有 Fs 都为 1,因此只需证明 0 < a < 1 时的收敛性。但是 (使用艾弗森括号),因此对于任意 a 选择 N > 1/a,对于 n > N,我们有
因此,序列 在所有 _F__X_ 连续的点上收敛到 。
这本书不会使用 R 均方收敛,但为了完整起见,将在下面给出定义。
如果对于任意实数 ,并且假设 对于所有 n 和 ,则随机变量序列 在 r 次方平均意义下(或在 范数下)收敛到随机变量 ,如果
Cramer-Wold 器将允许我们将随机变量的收敛技术从标量扩展到向量。
随机向量 。
设 是在同一概率空间上定义的随机变量序列,它们共享相同的概率分布 D 且相互独立。假设 D 的期望值 μ 和标准差 σ 存在且有限。
考虑总和。则 的期望值为 nμ,标准误差为 σ n1/2。此外,非正式地说,当 n 趋于 ∞ 时,Sn 的分布趋近于正态分布 N(nμ,σ2n)。