跳转至内容

统计/摘要/平均数/平均值

来自维基教科书,开放的书本,面向开放的世界

统计


  1. 介绍
    1. 什么是统计?
    2. 现代统计学中的学科
    3. 为什么要学习统计学? 0% developed
    4. 学习统计学需要了解什么?
  2. 不同类型的數據
    1. 原始数据和二手数据
    2. 定量数据和定性数据
  3. 数据收集方法
    1. 实验
    2. 抽样调查
    3. 观察性研究
  4. 数据分析
    1. 数据清理
    2. 移动平均线
  5. 汇总统计
    1. 集中趋势的度量
      1. 平均值、中位数和众数
      2. 几何平均数
      3. 调和平均数
      4. 算术平均数、几何平均数和调和平均数之间的关系
      5. 几何中位数
    2. 离散程度的度量
      1. 数据的范围
      2. 方差和标准差
      3. 四分位数和四分位距
      4. 分位数
  6. 数据展示
    1. 条形图
    2. 比较条形图
    3. 直方图
    4. 散点图
    5. 箱线图
    6. 饼图
    7. 比较饼图
    8. 象形图
    9. 折线图
    10. 频率多边形
  7. 概率
    1. 组合数学
    2. 伯努利试验
    3. 贝叶斯分析入门
  8. 分布
    1. 离散分布
      1. 均匀分布
      2. 伯努利分布
      3. 二项分布
      4. 泊松分布
      5. 几何分布
      6. 负二项分布
      7. 超几何分布
    2. 连续分布
      1. 均匀分布
      2. 指数分布
      3. 伽马分布
      4. 正态分布
      5. 卡方分布
      6. 学生t分布
      7. F分布
      8. 贝塔分布
      9. 威布尔分布
  9. 检验统计假设
    1. 统计检验的目的
    2. 使用的形式主义
    3. 不同类型的检验
    4. 单样本z检验
    5. 双样本z检验
    6. 单样本t检验
    7. 双样本t检验
    8. 配对样本t检验用于比较平均值
    9. 单因素方差分析F检验
    10. 单样本比例z检验
    11. 双样本比例z检验
    12. 检验比例A是否大于比例B在Microsoft Excel中的方法
    13. 斯皮尔曼等级相关系数
    14. 皮尔逊积差相关系数
    15. 卡方检验
      1. 卡方检验用于多个比例
      2. 卡方检验用于列联表
    16. 分布的近似值
  10. 点估计100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 无偏性
    2. 优良性度量
    3. UMVUE
    4. 完备性
    5. 充分性和最小充分性
    6. 辅助性
  11. 练习题
    1. 汇总统计问题
    2. 数据展示问题
    3. 分布问题
    4. 数据检验问题
  12. 数值方法
    1. 基础线性代数和格拉姆-施密特正交化
    2. 无约束优化
    3. 分位数回归
    4. 统计软件的数值比较
    5. Excel中的数值计算
    6. 统计/数值方法/随机数生成
  13. 时间序列分析
  14. 多元数据分析
    1. 主成分分析
    2. 度量数据的因子分析
    3. 有序数据的因子分析
    4. 典型相关分析
    5. 判别分析
  15. 特定数据集的分析
    1. 结核病分析
  16. 附录
    1. 作者
    2. 词汇表
    3. 索引
    4. 链接

编辑此框

平均值、中位数和众数

[编辑 | 编辑源代码]

平均值

[编辑 | 编辑源代码]

平均值,或更确切地说算术平均数,只是一组数字(或**数据集**)的算术平均值,用横线符号 表示。因此,变量 的平均值为 ,读作“x-bar”。它是通过将数据集中所有值加起来,然后除以数据集中值的个数来计算的:例如,取以下数据集:{1,2,3,4,5}。该数据集的平均值为

这里有一个更复杂的数据集:{10,14,86,2,68,99,1}。平均值的计算方法如下

中位数

[edit | edit source]

中位数是数据集中的“中间值”。也就是说,中位数是有序数据集的中心数字。

例如,让我们看看上面第二个数据集中的数据:{10,14,86,2,68,99,1}。它的中位数是多少?

  • 首先,我们将数据集按顺序排序:{1,2,10,14,68,85,99}
  • 接下来,我们确定数据集中的总点数(在本例中为 7)。
  • 最后,我们确定数据集的中心位置(在本例中为第 4 个位置),中心位置的数字就是我们的中位数 - {1,2,10,14,68,85,99},因此 14 是我们的中位数。
有用提示!
确定任何有序集的中心位置或位置的简单方法是将总点数加 1,然后除以 2。如果得到的结果是一个整数,那么这就是中心位置。如果得到的结果是一个分数,则取两边的两个整数。

因为我们的数据集有奇数个点,所以确定中心位置很容易 - 它在它之前的点数与它之后的点数相同。但如果我们的数据集有偶数个点呢?

让我们使用相同的数据集,但向其中添加一个新数字:{1,2,10,14,68,85,99,100} 这个集合的中位数是多少?

当你有偶数个点时,你必须确定数据集的两个中心位置。(请参阅侧边框以获取说明。)因此,对于一组 8 个数字,我们得到 (8 + 1) / 2 = 9 / 2 = 4 1/2,它两侧有 4 和 5。

查看我们的数据集,我们发现第 4 个和第 5 个数字是 14 和 68。从那里,我们回到我们信赖的朋友平均值来确定中位数。(14 + 68)/ 2 = 82 / 2 = 41。找到 2, 4, 6, 8 的中位数 => 首先我们必须计算数字以确定它的奇偶性,因为我们看到它是偶数,所以我们可以写:M=(4+6)/2=10/2=5 5 是上面顺序数字的中位数。

众数

[edit | edit source]

众数是数据集中最常见或“最频繁”的值。例如:以下数据集的众数 (1, 2, 5, 5, 6, 3) 是 5,因为它出现两次。这是数据集中最常见的值。具有一个众数的数据集被称为单峰,具有两个众数的数据集被称为双峰,具有两个以上众数的数据集被称为多峰。单峰数据集的一个例子是 {1, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9}。该数据集的众数为 4。双峰数据集的一个例子是 {1, 2, 2, 3, 3}。这是因为 2 和 3 都是众数。注意:如果数据集中所有点出现的频率都相等,那么将数据集描述为具有多个众数或没有众数是同样准确的。

中程数

[edit | edit source]

中程数是数据集中的最小值和最大值之间严格的算术平均值。

平均值、中位数和众数之间的关系

[edit | edit source]

平均值、中位数和众数彼此之间的关系可以提供有关数据分布的相对形状的一些信息。如果平均值、中位数和众数彼此大致相等,则可以假设分布大致对称。如果平均值 > 中位数 > 众数,则分布将右偏。如果平均值 < 中位数 < 众数,则分布将左偏。

问题

[edit | edit source]

1. 有一个老笑话这样说:“以中位数尺寸为参考,在划艇里放四个乒乓球和两只蓝鲸是完全可能的。”解释为什么这个说法是正确的。

<< 平均数 | 统计学 | 几何平均数 >>

华夏公益教科书