跳转到内容

统计学基础/显著性

来自维基教科书,开放的书籍,开放的世界

显著性

[编辑 | 编辑源代码]

在统计检验中,我们处理概率。以一种统计上可检验的方式提出我们的研究问题,就是问

如果零假设为真,我观察到我收集到的数据的可能性有多大?

更技术地说

p 值表示如果零假设为真,则看到如此极端数据的概率

我们设定一个阈值,最常见的是 99% 或 95%,这意味着我们承认我们可能被误导而拒绝零假设,分别为 1% 或 5% 的时间。P 必须低于此阈值才能拒绝零假设。也就是说,p 必须小于 0.01 或小于 0.05(99% 和 95% 的倒数,以小数表示)。

这个值,即p 值,被认为决定了检验结果是否显著。如果结果显著,则拒绝零假设。

选择检验

[编辑 | 编辑源代码]

人们经常发现上述第三步 - 选择正确的检验 - 最困难,但如果我们知道我们想做什么,并且对我们数据的性质有所了解,这并不难。下表涵盖了大量常见情况。

问题 因变量的度量 两个变量或组 两个以上变量或组 参数 非参数
是否存在关联? 名义 [1] 卡方检验
是否存在关联? 序数 两个 斯皮尔曼秩相关系数(并附带强度指示)
是否存在关联? 标量 两个 皮尔逊相关系数(并附带强度指示)
均值或中位数是否相同? 标量 两个 学生 t 检验 曼-惠特尼 U 检验
均值或中位数是否相同? 标量 两个以上 方差分析 (ANOVA) 克鲁斯卡尔-沃利斯检验
我能否从一个预测另一个? 标量 两个 两个以上独立 回归或多元回归

单尾还是双尾?

[编辑 | 编辑源代码]

当我们制定涉及参数或统计量值的比较的假设时,我们选择以两种方式之一提出问题。我们可以简单地问值是否不同,或者我们可以问一个值是否小于(或大于)另一个。在第一种情况下,我们将使用双尾检验来确定结果,而在第二种情况下,我们将使用单尾检验

  1. 这不是真的:可以测试两个以上名义变量的关联,但设计很复杂


1 导论

2 统计量

3 参数方法和非参数方法

4 描述性统计

5 推断统计:假设检验

6 自由度

7 显著性

8 关联

9 比较组或变量

10 回归

华夏公益教科书