统计学/概要/范围
样本(数据集)的范围只是数据中可能的最大差异,即最大值和最小值之间的差异。更准确的术语是“范围宽度”,通常用字母 R 或 w 表示。这两个单独的值(最大值和最小值)称为“范围限”。通常这些术语会被混淆,学生应该注意使用正确的术语。
例如,在一个样本中,值分别为 2 3 5 7 8 11 12,则范围是 11(|12|-|2|+1=11),范围限是 2 和 12。
范围是理解数据离散程度(散布)最简单、最容易理解的度量,虽然它在日常生活中被广泛使用,但对于严肃的统计工作来说太粗略了。它不是一个“稳健”的度量,因为显然在总体中找到最大值和最小值的可能性很大程度上取决于我们从总体中选择的样本大小,因此它的值可能在一个样本到另一个样本之间有很大的差异。此外,它不是数据的令人满意的描述符,因为它仅依赖于样本中的两个项目,而忽略了所有其他项目。离散程度的一个好得多的度量是标准差(s),它考虑了所有数据。它不仅比范围更稳健和“有效”,而且还适用于更广泛的统计操作。然而,范围仍然广泛用于对数据的简单描述,以及在质量控制图中。
然而,一组数据的平均范围是一个相当有效的度量(统计量),可以用作计算s的简便方法。在这种情况下,我们所做的是将数据细分为几个成员组,计算它们的平均范围,,并将其除以一个取决于 n 的系数(来自表格)。例如,在化学实验室中,分析样本通常是成对进行的,因此它们有大量现成数据来计算s。
(使用的系数 k 在标准差下给出。)
例如:如果我们有一个大小为 40 的样本,我们可以将其细分为 10 个子样本,每个子样本的大小为 n=4。如果我们发现它们的平均范围是,比如说,3.1,那么包含 40 个项目的父样本的标准差大约为 3.1/2.059 = 1.506。
现在有简单的电子计算器可用,它们只需按一下键就可以直接计算s,因此不再需要这样的权宜之计,尽管统计学学生应该熟悉它们。
{tBookCat}