统计/摘要/平均数/平均值
平均数,或更准确地说是算术平均数,仅仅是一组数字(或**数据集**)的算术平均值,用横线符号 表示。因此变量 的平均数是 ,读作“x-bar”。它可以通过将数据集中的所有值加起来,然后除以数据集中的值的数量来计算:.例如,考虑以下数据集:{1,2,3,4,5}。此数据的平均数将是
这是一个更复杂的数据集:{10,14,86,2,68,99,1}。平均数将按如下方式计算
中位数
[edit | edit source]中位数是数据集中的“中间值”。也就是说,中位数是按顺序排列的数据集的中心位置上的数字。
例如,让我们看看上面第二个数据集中的数据:{10,14,86,2,68,99,1}。它的中位数是多少?
- 首先,我们将数据集按顺序排列:{1,2,10,14,68,85,99}
- 接下来,我们确定数据集中的点数总数(在本例中为 7)。
- 最后,我们确定数据集的中心位置(在本例中为第 4 个位置),中心位置上的数字就是我们的中位数 - {1,2,10,14,68,85,99},因此 14 是我们的中位数。
有用提示! | |
---|---|
确定任何有序集合的中心位置或位置的简单方法是将点数总数加 1,然后除以 2。如果得到的结果是整数,那么这就是中心位置。如果得到的结果是小数,则取两边的两个整数。 |
因为我们的数据集有奇数个点,所以确定中心位置很容易 - 它之前和之后会有相同数量的点。但是如果我们的数据集有偶数个点呢?
让我们取相同的数据集,但添加一个新数字:{1,2,10,14,68,85,99,100} 这个集合的中位数是多少?
当您有偶数个点时,您必须确定数据集的两个中心位置。(有关说明,请参见侧边框。)因此对于一个包含 8 个数字的集合,我们得到 (8 + 1) / 2 = 9 / 2 = 4 1/2,其两边有 4 和 5。
查看我们的数据集,我们看到第 4 个和第 5 个数字是 14 和 68。然后,我们回到我们信赖的朋友平均数来确定中位数。(14 + 68)/ 2 = 82 / 2 = 41。求 2、4、6、8 的中位数 => 首先我们要统计数字以确定其奇偶性,我们发现它是偶数,所以我们可以写:M=(4+6)/2=10/2=5 5 是上面顺序数字的中位数。
众数
[edit | edit source]众数是数据集中最常见或“最频繁”的值。例如:以下数据集 (1, 2, 5, 5, 6, 3) 的众数是 5,因为它出现了两次。这是数据集中最常见的值。具有一个众数的数据集被称为单峰,具有两个众数的数据集被称为双峰,具有两个以上众数的数据集被称为多峰。单峰数据集的例子是 {1, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9}。这个数据集的众数是 4。双峰数据集的例子是 {1, 2, 2, 3, 3}。这是因为 2 和 3 都是众数。请注意:如果数据集中所有点都以相同的频率出现,那么将数据集描述为具有多个众数或没有众数都是一样的准确。
中程数
[edit | edit source]中程数是数据集中的最小值和最大值之间的算术平均数。
平均数、中位数和众数的关系
[edit | edit source]平均数、中位数和众数之间的关系可以提供有关数据分布相对形状的一些信息。如果平均数、中位数和众数近似相等,则可以假设分布近似对称。如果平均数 > 中位数 > 众数,则分布将向右偏斜。如果平均数 < 中位数 < 众数,则分布将向左偏斜。
问题
[edit | edit source]1. 有一个老笑话说道:“以中位数大小作为参考,完全可以在一只划艇中依次容纳四个乒乓球和两只蓝鲸。”解释为什么这句话是正确的。