跳转到内容

统计/摘要/平均数/平均值

来自维基教科书,开放世界开放书籍

统计学


  1. 介绍
    1. 什么是统计学?
    2. 现代统计学中的学科
    3. 为什么要学习统计学? 0% developed
    4. 学习统计学需要知道什么?
  2. 不同类型的数据
    1. 原始数据和次级数据
    2. 定量数据和定性数据
  3. 数据收集方法
    1. 实验
    2. 抽样调查
    3. 观察性研究
  4. 数据分析
    1. 数据清理
    2. 移动平均
  5. 汇总统计
    1. 集中趋势的度量
      1. 平均数、中位数和众数
      2. 几何平均数
      3. 调和平均数
      4. 算术、几何和调和平均数之间的关系
      5. 几何中位数
    2. 离散程度的度量
      1. 数据的范围
      2. 方差和标准差
      3. 四分位数和四分位数间距
      4. 分位数
  6. 数据显示
    1. 条形图
    2. 比较条形图
    3. 直方图
    4. 散点图
    5. 箱线图
    6. 饼图
    7. 比较饼图
    8. 象形图
    9. 折线图
    10. 频数多边形
  7. 概率
    1. 组合学
    2. 伯努利试验
    3. 贝叶斯分析入门
  8. 分布
    1. 离散分布
      1. 均匀分布
      2. 伯努利分布
      3. 二项分布
      4. 泊松分布
      5. 几何分布
      6. 负二项分布
      7. 超几何分布
    2. 连续分布
      1. 均匀分布
      2. 指数分布
      3. 伽马分布
      4. 正态分布
      5. 卡方分布
      6. 学生t分布
      7. F分布
      8. 贝塔分布
      9. 威布尔分布
  9. 检验统计假设
    1. 统计检验的目的
    2. 使用的形式主义
    3. 不同类型的检验
    4. 单个均值的z检验
    5. 两个均值的z检验
    6. 单个均值的t检验
    7. 两个均值的t检验
    8. 配对t检验比较均值
    9. 单因素方差分析F检验
    10. 单个比例的z检验
    11. 两个比例的z检验
    12. 在Microsoft Excel中检验比例A是否大于比例B
    13. 斯皮尔曼等级相关系数
    14. 皮尔逊积矩相关系数
    15. 卡方检验
      1. 多个比例的卡方检验
      2. 列联表的卡方检验
    16. 分布的近似
  10. 点估计100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 无偏性
    2. 优良性的度量
    3. UMVUE
    4. 完备性
    5. 充分性和最小充分性
    6. 辅助性
  11. 练习题
    1. 汇总统计问题
    2. 数据显示问题
    3. 分布问题
    4. 数据检验问题
  12. 数值方法
    1. 基础线性代数和Gram-Schmidt正交化
    2. 无约束优化
    3. 分位数回归
    4. 统计软件的数值比较
    5. Excel中的数值计算
    6. 统计/数值方法/随机数生成
  13. 时间序列分析
  14. 多元数据分析
    1. 主成分分析
    2. 度量数据的因子分析
    3. 序数数据的因子分析
    4. 典型相关分析
    5. 判别分析
  15. 特定数据集的分析
    1. 结核病分析
  16. 附录
    1. 作者
    2. 术语表
    3. 索引
    4. 链接

编辑此框

平均数、中位数和众数

[编辑 | 编辑源代码]

平均数

[编辑 | 编辑源代码]

平均数,或更准确地说是算术平均数,仅仅是一组数字(或**数据集**)的算术平均值,用横线符号 表示。因此变量 的平均数是 ,读作“x-bar”。它可以通过将数据集中的所有值加起来,然后除以数据集中的值的数量来计算:.例如,考虑以下数据集:{1,2,3,4,5}。此数据的平均数将是

这是一个更复杂的数据集:{10,14,86,2,68,99,1}。平均数将按如下方式计算

中位数

[edit | edit source]

中位数是数据集中的“中间值”。也就是说,中位数是按顺序排列的数据集的中心位置上的数字。

例如,让我们看看上面第二个数据集中的数据:{10,14,86,2,68,99,1}。它的中位数是多少?

  • 首先,我们将数据集按顺序排列:{1,2,10,14,68,85,99}
  • 接下来,我们确定数据集中的点数总数(在本例中为 7)。
  • 最后,我们确定数据集的中心位置(在本例中为第 4 个位置),中心位置上的数字就是我们的中位数 - {1,2,10,14,68,85,99},因此 14 是我们的中位数。
有用提示!
确定任何有序集合的中心位置或位置的简单方法是将点数总数加 1,然后除以 2。如果得到的结果是整数,那么这就是中心位置。如果得到的结果是小数,则取两边的两个整数。

因为我们的数据集有奇数个点,所以确定中心位置很容易 - 它之前和之后会有相同数量的点。但是如果我们的数据集有偶数个点呢?

让我们取相同的数据集,但添加一个新数字:{1,2,10,14,68,85,99,100} 这个集合的中位数是多少?

当您有偶数个点时,您必须确定数据集的两个中心位置。(有关说明,请参见侧边框。)因此对于一个包含 8 个数字的集合,我们得到 (8 + 1) / 2 = 9 / 2 = 4 1/2,其两边有 4 和 5。

查看我们的数据集,我们看到第 4 个和第 5 个数字是 14 和 68。然后,我们回到我们信赖的朋友平均数来确定中位数。(14 + 68)/ 2 = 82 / 2 = 41。求 2、4、6、8 的中位数 => 首先我们要统计数字以确定其奇偶性,我们发现它是偶数,所以我们可以写:M=(4+6)/2=10/2=5 5 是上面顺序数字的中位数。

众数

[edit | edit source]

众数是数据集中最常见或“最频繁”的值。例如:以下数据集 (1, 2, 5, 5, 6, 3) 的众数是 5,因为它出现两次。这是数据集中最常见的值。具有一个众数的数据集被称为单峰,具有两个众数的数据集被称为双峰,具有两个以上众数的数据集被称为多峰。单峰数据集的例子是 {1, 2, 3, 4, 4, 4, 5, 6, 7, 8, 8, 9}。这个数据集的众数是 4。双峰数据集的例子是 {1, 2, 2, 3, 3}。这是因为 2 和 3 都是众数。注意:如果数据集中所有点都以相同的频率出现,那么将数据集描述为具有多个众数或没有众数都是一样的准确。

中程数

[edit | edit source]

中程数是数据集中的最小值和最大值之间的算术平均数。

平均数、中位数和众数的关系

[edit | edit source]

平均数、中位数和众数之间的关系可以提供有关数据分布相对形状的一些信息。如果平均数、中位数和众数近似相等,则可以假设分布近似对称。如果平均数 > 中位数 > 众数,则分布将向右偏斜。如果平均数 < 中位数 < 众数,则分布将向左偏斜。

问题

[edit | edit source]

1. 有一个老笑话说道:“以中位数大小作为参考,完全可以在一只划艇中依次容纳四个乒乓球和两只蓝鲸。”解释为什么这句话是正确的。

<< 平均数 | 统计学 | 几何平均数 >>

华夏公益教科书