统计/摘要/平均数/平均值
平均值,或更确切地说算术平均数,只是一组数字(或**数据集**)的算术平均值,用横线符号 表示。因此,变量 的平均值为 ,读作“x-bar”。它是通过将数据集中所有值加起来,然后除以数据集中值的个数来计算的:。例如,取以下数据集:{1,2,3,4,5}。该数据集的平均值为
这里有一个更复杂的数据集:{10,14,86,2,68,99,1}。平均值的计算方法如下
中位数
[edit | edit source]中位数是数据集中的“中间值”。也就是说,中位数是有序数据集的中心数字。
例如,让我们看看上面第二个数据集中的数据:{10,14,86,2,68,99,1}。它的中位数是多少?
- 首先,我们将数据集按顺序排序:{1,2,10,14,68,85,99}
- 接下来,我们确定数据集中的总点数(在本例中为 7)。
- 最后,我们确定数据集的中心位置(在本例中为第 4 个位置),中心位置的数字就是我们的中位数 - {1,2,10,14,68,85,99},因此 14 是我们的中位数。
有用提示! | |
---|---|
确定任何有序集的中心位置或位置的简单方法是将总点数加 1,然后除以 2。如果得到的结果是一个整数,那么这就是中心位置。如果得到的结果是一个分数,则取两边的两个整数。 |
因为我们的数据集有奇数个点,所以确定中心位置很容易 - 它在它之前的点数与它之后的点数相同。但如果我们的数据集有偶数个点呢?
让我们使用相同的数据集,但向其中添加一个新数字:{1,2,10,14,68,85,99,100} 这个集合的中位数是多少?
当你有偶数个点时,你必须确定数据集的两个中心位置。(请参阅侧边框以获取说明。)因此,对于一组 8 个数字,我们得到 (8 + 1) / 2 = 9 / 2 = 4 1/2,它两侧有 4 和 5。
查看我们的数据集,我们发现第 4 个和第 5 个数字是 14 和 68。从那里,我们回到我们信赖的朋友平均值来确定中位数。(14 + 68)/ 2 = 82 / 2 = 41。找到 2, 4, 6, 8 的中位数 => 首先我们必须计算数字以确定它的奇偶性,因为我们看到它是偶数,所以我们可以写:M=(4+6)/2=10/2=5 5 是上面顺序数字的中位数。
众数
[edit | edit source]众数是数据集中最常见或“最频繁”的值。例如:以下数据集的众数 (1, 2, 5, 5, 6, 3) 是 5,因为它出现两次。这是数据集中最常见的值。具有一个众数的数据集被称为单峰,具有两个众数的数据集被称为双峰,具有两个以上众数的数据集被称为多峰。单峰数据集的一个例子是 {1, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9}。该数据集的众数为 4。双峰数据集的一个例子是 {1, 2, 2, 3, 3}。这是因为 2 和 3 都是众数。请注意:如果数据集中所有点出现的频率都相等,那么将数据集描述为具有多个众数或没有众数是同样准确的。
中程数
[edit | edit source]中程数是数据集中的最小值和最大值之间严格的算术平均值。
平均值、中位数和众数之间的关系
[edit | edit source]平均值、中位数和众数彼此之间的关系可以提供有关数据分布的相对形状的一些信息。如果平均值、中位数和众数彼此大致相等,则可以假设分布大致对称。如果平均值 > 中位数 > 众数,则分布将右偏。如果平均值 < 中位数 < 众数,则分布将左偏。
问题
[edit | edit source]1. 有一个老笑话这样说:“以中位数尺寸为参考,在划艇里放四个乒乓球和两只蓝鲸是完全可能的。”解释为什么这个说法是正确的。