跳转到内容

统计学/统计假设检验

来自维基教科书,开放的书籍,开放的世界
Two examples of how the means of two distributions may be different, leading to two different statistical hypotheses
相等分布,但均值不同。

对于许多不同类型的数据,有许多不同的检验方法。入门方法是了解您的数据类型。变量是定量的还是定性的?某些检验方法适合于某些类型的数据,具体取决于数据的大小、分布或尺度。此外,了解数据样本如何不同也很重要。定量数据的三个主要特征是:集中趋势、离散程度和形状。

当大多数人“检验”定量数据时,他们往往会进行集中趋势检验。为什么?假设您有两组数据,并且您想查看它们是否彼此不同。检验此方法的一种方法是检验其集中趋势(例如均值)是否不同。

想象两个对称的钟形曲线,在每个曲线的中间画一条垂直线,如图所示。如果一个样本与另一个样本非常不同(值明显更高等),则均值通常会不同。因此,在检验两个样本是否不同时,通常会比较两个均值。

也可以比较两个中位数(集中趋势的另一个度量)。或者,也许有人希望检验两个样本,以查看它们是否具有相同的离散程度或变异性。由于集中趋势、离散程度等的统计量遵循不同的分布,因此必须遵循和使用不同的检验程序。

最后,大多数人将假设检验的结果总结为一个特定值 - p 值。如果 p 值小于显著性水平(通常 ,但在其他科学领域(例如医学)中更低),则您拒绝原假设,但这并不意味着您接受备择假设。p 值本质上是获得至少与观察到的检验统计量一样极端的检验统计量的概率。如果 p 值大于显著性水平,则您无法拒绝原假设,但这并不意味着原假设是正确的。

华夏公益教科书