统计/测试数据/t 检验
注意:以下文本中的一些陈述存在争议。对于小样本量非参数检验,例如 Mann-Whitney U 检验或 Wilcoxon 秩和检验,可能更倾向于使用它们,而不是 t 检验。
t 检验是用于计算小样本均值显著性的最强大的参数检验。
单样本 t 检验具有以下零假设
其中希腊字母 (mu) 代表总体均值,c 代表其假定的(假设的)值。在统计学中,通常使用希腊字母表示总体参数,使用罗马字母表示样本统计量。t 检验是适合大样本的 z 检验的小样本模拟。小样本通常被认为是样本量 n<30 的样本。
t 检验对于小样本是必要的,因为它们的分布不是正态分布。如果样本量很大(n>=30),则统计理论表明样本均值呈正态分布,可以使用单均值 z 检验。这是著名的统计定理——中心极限定理的结果。
然而,t 检验仍然可以应用于更大的样本,并且随着样本量 n 越来越大,t 检验和 z 检验的结果越来越接近。在极限情况下,当自由度无限时,t 检验和 z 检验的结果变得相同。
为了执行 t 检验,首先需要计算“自由度”。该数量考虑了样本量和正在估计的参数数量。在这里,总体参数 mu 正在被样本统计量 x-bar(样本数据的均值)估计。对于 t 检验,单均值的自由度为 n-1。这是因为只有一个总体参数(总体均值)被样本统计量(样本均值)估计。
degrees of freedom (df)=n-1
例如,对于样本量 n=15,df=14。
一位大学教授想将她的学生成绩与全国平均水平进行比较。她从 20 名学生中随机抽取一个简单随机样本 (SRS),这些学生在一个标准化考试中的平均成绩为 50.2。他们的成绩标准差为 2.5。该考试的全国平均成绩为 60。她想知道她的学生的成绩是否 **明显** 低于全国平均水平。
显著性检验遵循几个步骤的程序。
首先,用分布来描述问题,并识别感兴趣的参数。提及样本。我们将假设教授班级中学生的成绩 (X) 近似呈正态分布,未知参数为 μ 和 σ
用符号和文字陈述假设。
零假设是她的学生的成绩与全国平均水平相当。
备择假设是她的学生的成绩低于全国平均水平。
其次,确定要使用的检验。由于我们有一个小样本的 SRS,并且不知道总体的标准差,我们将使用单样本 t 检验。
单样本检验的 t 统计量 T 的公式如下
其中 是样本均值,S 是样本标准差。
一个很常见的错误是说 t 检验统计量的公式是
这不是一个统计量,因为 μ 是未知的,这在这样的问题中至关重要。大多数人甚至没有注意到这一点。这个公式的另一个问题是使用了 x 和 s。它们应该被认为是样本统计量,而不是它们的值。
正确的通用公式是
其中,c 是原假设指定的 μ 的假设值。
(样本标准差除以样本大小的平方根称为样本的“标准误”)。
步骤 4
[edit | edit source]说明在原假设下检验统计量的分布。在 H0 下,统计量 T 将服从自由度为 19 的学生 t 分布:.
步骤 5
[edit | edit source]通过输入以下值来计算检验统计量 T 的观察值 t
步骤 6
[edit | edit source]确定检验统计量 T 的值 t 的所谓 p 值。我们将拒绝原假设,因为 T 的值太小,因此我们计算左尾 p 值
- p 值
学生 t 分布在概率为 0.95 和自由度为 19 时给出 。p 值约为 1.777e-13。
步骤 7
[edit | edit source]最后,解释结果在问题中的意义。p 值表明结果几乎肯定不是偶然发生的,我们有足够的证据来 **拒绝原假设**。教授的学生得分确实显著低于全国平均水平。