给定一个无限的独立同分布随机变量序列X1, X2, ...,其有限期望值为E(X1) = E(X2) = ... = µ < ∞,我们感兴趣的是样本平均数的收敛性
X ¯ n = 1 n ( X 1 + ⋯ + X n ) . {\displaystyle {\overline {X}}_{n}={\tfrac {1}{n}}(X_{1}+\cdots +X_{n}).}
定理: X ¯ n → P μ for n → ∞ . {\displaystyle {\overline {X}}_{n}\,{\xrightarrow {P}}\,\mu \qquad {\textrm {for}}\qquad n\to \infty .}
证明
这个证明使用了有限方差的假设 Var ( X i ) = σ 2 {\displaystyle \operatorname {Var} (X_{i})=\sigma ^{2}} (对于所有 i {\displaystyle i} )。随机变量的独立性意味着它们之间没有相关性,我们有
Var ( X ¯ n ) = n σ 2 n 2 = σ 2 n . {\displaystyle \operatorname {Var} ({\overline {X}}_{n})={\frac {n\sigma ^{2}}{n^{2}}}={\frac {\sigma ^{2}}{n}}.}
序列的公共均值μ是样本平均数的均值
E ( X ¯ n ) = μ . {\displaystyle E({\overline {X}}_{n})=\mu .}
使用切比雪夫不等式对 X ¯ n {\displaystyle {\overline {X}}_{n}} 会得到
P ( | X ¯ n − μ | ≥ ε ) ≤ σ 2 n ε 2 . {\displaystyle \operatorname {P} (\left|{\overline {X}}_{n}-\mu \right|\geq \varepsilon )\leq {\frac {\sigma ^{2}}{n\varepsilon ^{2}}}.}
这可以用来得到以下内容
P ( | X ¯ n − μ | < ε ) = 1 − P ( | X ¯ n − μ | ≥ ε ) ≥ 1 − σ 2 n ε 2 . {\displaystyle \operatorname {P} (\left|{\overline {X}}_{n}-\mu \right|<\varepsilon )=1-\operatorname {P} (\left|{\overline {X}}_{n}-\mu \right|\geq \varepsilon )\geq 1-{\frac {\sigma ^{2}}{n\varepsilon ^{2}}}.}
当n趋于无穷大时,表达式趋于1。根据概率收敛的定义(参见 随机变量的收敛),我们得到了
X ¯ n → P μ for n → ∞ . {\displaystyle {\overline {X}}_{n}\,{\xrightarrow {P}}\,\mu \qquad {\textrm {for}}\qquad n\to \infty .}