跳转到内容

代数/第 1 章/统计学

来自维基教科书,开放的书籍,开放的世界
代数/第 1 章
 ← 概率 统计学

1.10: 统计学导论


集中趋势和离散程度的度量

[编辑 | 编辑源代码]

以下三个数字代表了考虑数据集的平均值的三种不同方式。

平均数 - 这是我们通常认为的数据集的“平均值”。平均数可以通过将数据集中所有值求和并除以数据集的大小(即集合中元素的数量)来找到。在数学符号中,

例如:假设 1, 2, 4, 6, 8, 9 是我们的数据集,则总和为 1 + 2 + 4 + 6 + 8 + 9 = 30,并且数据集中有 6 个元素,因此平均数为 30/6 = 5

平均数虽然是一个非常有用的统计量,但也有其缺陷。值得注意的是,它的值可能会受到异常值的严重影响 - 数据集中比大多数数据明显更高或更低的值。对于此类数据集,通常最好使用中位数来描述。

中位数 - 这是我们数据集的中间值。要找到中位数,您必须首先将数据值按数值顺序排列(例如,从小到大)。如果您的数据集中有奇数个元素,则中间只有一个数字,这个数字就是中位数。如果您的数据集中有偶数个元素,则中位数是中间两个数字的平均值。例如:如果我们的数据集是 2, 2, 3, 4, 4, 5, 6, 7, 8, 9, 12, 13, 16, 22 是我们的数据集。因为它有偶数个元素,我们必须取中间两个的平均值,在本例中是 6 和 7,因此中位数是 6.5。

众数 - 众数指的是一个或多个数字在一个数据集中出现的次数。由于平均数、中位数和众数经常被混淆,记住众数的一个简单方法是“最常出现”。众数的前两个字母是“m”和“o”,想象它们代表“最常出现”以帮助您记住。如果两个或更多个不同的值在重复次数上并列第一,则称该数据集具有多个众数。如果您被要求找到具有多个众数的数据集的众数,则应列出所有众数。如果数据集中的元素没有重复,则没有众数。

例如:假设 1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 7 是我们的数据集,则众数将是 2 和 5。它们都出现了三次,而三次是数据集中最大的重复次数。

以下数量告诉我们数据集的离散程度。

极差 - 数据集中最大和最小数字之间的差。请注意,这意味着极差永远不会为负。


平均数

让我们看一下以下数据集

数据值:10, 13, 4, 7, 9 因此 n = 5

现在将这些值加在一起

10 + 13 + 4 + 7 + 9 = 43

   43 / 5 = 8.6

平均数 = 8.6


中位数

情况 1

数据值:10, 13, 4, 7, 8 因此 n = 5

数值顺序:4, 7, 8, 13, 10

由于 8 是中间的数字,

中位数 = 8

情况 2

数据值:10, 13, 4, 7, 8, 10 因此 n = 6

数值顺序:4, 7, 8, 10, 10, 13

中间数字:8 和 10

求平均数:8 + 10 = 18

          18 / 2 = 9

中位数 = 9


众数

数据值:10, 13, 4, 7, 8, 10

10 在数据集中出现了两次。

众数 = 10

数据值:4, 9, 13, 18, 4, 2, 9, 4, 13, 8, 9

4 和 9 都具有三个数据值。

众数 = 4, 9


极差

数据值:10, 13, 4, 7, 8

数值顺序:4, 7, 8, 10, 13

最后一个和第一个的差:13 - 4 = 9

极差 = 9


找出以下数据集的平均数、中位数、众数和极差
5, 8, 12, 4, 8, 9, 11, 2

1

平均数 =

2

中位数 =

3

众数 =

4

极差 =

24, 26, 37, 24, 16, 44, 26, 34, 24

5

平均数 =

6

中位数 =

7

众数 =

8

极差 =

15, 48, 89, 74, 25, 36, 57, 51, 17, 22

9

平均数 =

10

中位数 =

11 有多少个众数?

12

极差 =

2, 6, 8, 7, 8, 2, 2, 9, 10

13

平均数 =

14

中位数 =

15

众数 =

16

极差 =

华夏公益教科书