统计/测试数据/t 检验

注意：以下文本中的一些陈述存在争议。对于小样本量非参数检验，例如 Mann-Whitney U 检验或 Wilcoxon 秩和检验，可能更倾向于使用它们，而不是 t 检验。

t 检验是用于计算小样本均值显著性的最强大的参数检验。

单样本 t 检验具有以下零假设

$H_{0}:\quad \mu =c$

其中希腊字母 $\mu$ (mu) 代表总体均值，c 代表其假定的（假设的）值。在统计学中，通常使用希腊字母表示总体参数，使用罗马字母表示样本统计量。t 检验是适合大样本的 z 检验的小样本模拟。小样本通常被认为是样本量 n<30 的样本。

t 检验对于小样本是必要的，因为它们的分布不是正态分布。如果样本量很大（n>=30），则统计理论表明样本均值呈正态分布，可以使用单均值 z 检验。这是著名的统计定理——中心极限定理的结果。

然而，t 检验仍然可以应用于更大的样本，并且随着样本量 n 越来越大，t 检验和 z 检验的结果越来越接近。在极限情况下，当自由度无限时，t 检验和 z 检验的结果变得相同。

为了执行 t 检验，首先需要计算“自由度”。该数量考虑了样本量和正在估计的参数数量。在这里，总体参数 mu 正在被样本统计量 x-bar（样本数据的均值）估计。对于 t 检验，单均值的自由度为 n-1。这是因为只有一个总体参数（总体均值）被样本统计量（样本均值）估计。

degrees of freedom (df)=n-1

例如，对于样本量 n=15，df=14。

一位大学教授想将她的学生成绩与全国平均水平进行比较。她从 20 名学生中随机抽取一个简单随机样本 (SRS)，这些学生在一个标准化考试中的平均成绩为 50.2。他们的成绩标准差为 2.5。该考试的全国平均成绩为 60。她想知道她的学生的成绩是否 **明显** 低于全国平均水平。

显著性检验遵循几个步骤的程序。

首先，用分布来描述问题，并识别感兴趣的参数。提及样本。我们将假设教授班级中学生的成绩 (X) 近似呈正态分布，未知参数为 μ 和 σ

用符号和文字陈述假设。

$H_{O}:\quad \mu =60$

零假设是她的学生的成绩与全国平均水平相当。

$H_{A}:\quad \mu <60$

备择假设是她的学生的成绩低于全国平均水平。

其次，确定要使用的检验。由于我们有一个小样本的 SRS，并且不知道总体的标准差，我们将使用单样本 t 检验。

单样本检验的 t 统计量 T 的公式如下

T={\frac {{\overline {X}}-60}{S/{\sqrt {20}}}}

其中 ${\overline {X}}$ 是样本均值，S 是样本标准差。

一个很常见的错误是说 t 检验统计量的公式是

T={\frac {{\overline {x}}-\mu }{s/{\sqrt {n}}}}

这不是一个统计量，因为 μ 是未知的，这在这样的问题中至关重要。大多数人甚至没有注意到这一点。这个公式的另一个问题是使用了 x 和 s。它们应该被认为是样本统计量，而不是它们的值。

正确的通用公式是

T={\frac {{\overline {X}}-c}{S/{\sqrt {n}}}}

其中，c 是原假设指定的 μ 的假设值。

（样本标准差除以样本大小的平方根称为样本的“标准误”）。

说明在原假设下检验统计量的分布。在 H₀ 下，统计量 T 将服从自由度为 19 的学生 t 分布： $T\sim \tau \cdot (20-1)$ .

通过输入以下值来计算检验统计量 T 的观察值 t

t={\frac {{\overline {x}}-60}{s/{\sqrt {20}}}}={\frac {50.2-60.0}{2.5/{\sqrt {20}}}}={\frac {-9.8}{2.5/4.47}}={\frac {-9.8}{0.559}}=-17.5

确定检验统计量 T 的值 t 的所谓 p 值。我们将拒绝原假设，因为 T 的值太小，因此我们计算左尾 p 值

p 值

=P(T\leq t;H_{0})=P(T(19)\leq -17.5)\approx 0

学生 t 分布在概率为 0.95 和自由度为 19 时给出 $T(19)=1.729$ 。p 值约为 1.777e-13。

最后，解释结果在问题中的意义。p 值表明结果几乎肯定不是偶然发生的，我们有足够的证据来 **拒绝原假设**。教授的学生得分确实显著低于全国平均水平。