代数/第 1 章/统计学
1.10:统计学导论
以下三个数字代表了三种不同的思考数据集平均值的方法。
平均数 - 这是我们通常认为的数据集的“平均值”。平均数可以通过将数据集中的所有值相加并除以数据集的大小(即集合中的元素数量)来找到。在数学符号中,
例如:假设 1, 2, 4, 6, 8, 9 是我们的数据集,那么总和是 1 + 2 + 4 + 6 + 8 + 9 = 30,数据集中有 6 个元素,所以平均数是 30/6 = 5。
平均数虽然是一个非常有用的统计量,但也存在缺陷。值得注意的是,它的值可能会受到异常值的很大影响——数据集中的数字明显高于或低于大多数数据。通常情况下,最好使用中位数来描述此类数据集。
中位数 - 这是我们数据集的中间值。要找到中位数,您必须首先将数据值按数值顺序排列(例如,从小到大)。如果您在数据集中有奇数个元素,那么中间将只有一个数字,这个数字就是中位数。如果您在数据集中有偶数个元素,那么中位数是中间两个数字的平均值。例如。如果我们的数据集是 2, 2, 3, 4, 4, 5, 6, 7, 8, 9, 12, 13, 16, 22,那么它就是我们的数据集。因为它有偶数个元素,所以我们必须取中间两个的平均值,在本例中是 6 和 7,所以中位数是 6.5。
众数 - 众数指的是一个数字或多个数字在一个数据集中出现的次数。由于平均数、中位数和众数经常被混淆,所以记住众数的一个简单方法是“最常出现”。众数的前两个字母是“m”和“o”,想象它代表“最常出现”,这将有助于您记住。如果两个或多个不同的值出现次数最多相同,则该数据集被称为有多个众数。如果要求您找到有多个众数的数据集的众数,则应列出所有众数。如果数据集中的任何元素都没有重复,则没有众数。
例如。假设 1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 7 是我们的数据集,那么众数将是 2 和 5。它们都出现了三次,而 3 是我们数据集中重复的最大次数。
以下数量告诉我们数据集的离散程度。
极差 - 数据集中最大数字和最小数字之间的差值。请注意,这意味着极差永远不会是负数。
平均数
让我们看看以下数据集
数据值:10, 13, 4, 7, 9,所以 n = 5
现在将这些值加在一起
10 + 13 + 4 + 7 + 9 = 43
43 / 5 = 8.6
平均数 = 8.6
中位数
情况 1
数据值:10, 13, 4, 7, 8,所以 n = 5
数值顺序:4, 7, 8, 13, 10
由于 8 是中间数字,
中位数 = 8
情况 2
数据值:10, 13, 4, 7, 8, 10,所以 n = 6
数值顺序:4, 7, 8, 10, 10, 13
中间数字:8 和 10
求平均数:8 + 10 = 18
18 / 2 = 9
中位数 = 9
众数
数据值:10, 13, 4, 7, 8, 10
10 在数据集中出现了两次。
众数 = 10
数据值:4, 9, 13, 18, 4, 2, 9, 4, 13, 8, 9
4 和 9 都具有三个数据值。
众数 = 4, 9
极差
数据值:10, 13, 4, 7, 8
数值顺序:4, 7, 8, 10, 13
最后一个数字和第一个数字的差值:13 - 4 = 9
极差 = 9