统计学/测试数据/测试类型
外观
< 统计学
统计检验始终是关于所关注总体(分布)的一个或多个参数。适当的检验取决于关于此(这些)参数的零假设和备择假设的类型以及从样本中获得的信息。
据推测,英国儿童最近体重增加。因此,我们假设儿童(例如 12 岁)的体重 X 的总体平均数 μ 是所关注的参数。在最近的过去,这组儿童的平均体重为 45 公斤。因此,零假设(无变化)为
- .
由于我们怀疑体重会增加,因此备择假设为
- .
随机抽取的 100 个孩子,平均体重为 47 公斤,标准差为 8 公斤。
由于可以合理地假设体重呈正态分布,因此适当的检验将是 t 检验,检验统计量为
- .
在零假设下,T 将服从自由度为 99 的学生 t 分布,这意味着它近似于标准正态分布。
当 T 的值较大时,我们将拒绝零假设。对于此样本,T 的值为
- .
这是一个很大的值吗?这部分取决于我们的要求。观察值 t 的 p 值为
- ,
其中 Z 代表标准正态分布的随机变量。
如果我们不太苛刻,这个值足够小,所以我们有理由拒绝零假设并认为我们的推测是正确的。
现在假设我们丢失了单个数据,但仍然知道样本中的最大体重为 68 公斤。那么我们就不能使用 t 检验,而必须使用基于统计量 max(X) 的检验。
也可能我们对体重分布的假设存在疑问。为了避免讨论,我们可以使用无分布检验而不是 t 检验。
统计检验从一个假设开始;该假设的形式决定了可以使用的检验类型。在某些情况下,只有一种是合适的;而在另一些情况下,我们可能有一些选择。
例如:如果假设涉及单个总体平均值 () 的值,那么就表明需要进行单样本均值检验。是否应该使用 z 检验或 t 检验取决于其他因素(每个检验都有其自身的条件要求)。
对每种检验类型适用条件的完整列表可能超出了本工作的范围;有关每种检验的适用条件和要求的更多信息,请参阅有关各种检验类型的部分。