跳转到内容

统计/数据收集方法/抽样调查

来自维基教科书,开放书籍,面向开放世界

统计


  1. 介绍
    1. 什么是统计学?
    2. 现代统计学中的学科
    3. 为什么要学习统计学? 0% developed
    4. 学习统计学需要了解什么?
  2. 不同类型的数据
    1. 原始数据和二手数据
    2. 定量数据和定性数据
  3. 数据收集方法
    1. 实验
    2. 抽样调查
    3. 观察性研究
  4. 数据分析
    1. 数据清洗
    2. 移动平均
  5. 汇总统计
    1. 中心趋势的度量
      1. 平均数、中位数和众数
      2. 几何平均数
      3. 调和平均数
      4. 算术平均数、几何平均数和调和平均数之间的关系
      5. 几何中位数
    2. 离散程度的度量
      1. 数据的范围
      2. 方差和标准差
      3. 四分位数和四分位距
      4. 分位数
  6. 数据展示
    1. 条形图
    2. 比较条形图
    3. 直方图
    4. 散点图
    5. 箱线图
    6. 饼图
    7. 比较饼图
    8. 象形图
    9. 折线图
    10. 频数多边形
  7. 概率
    1. 组合学
    2. 伯努利试验
    3. 贝叶斯分析入门
  8. 分布
    1. 离散分布
      1. 均匀分布
      2. 伯努利分布
      3. 二项分布
      4. 泊松分布
      5. 几何分布
      6. 负二项分布
      7. 超几何分布
    2. 连续分布
      1. 均匀分布
      2. 指数分布
      3. 伽马分布
      4. 正态分布
      5. 卡方分布
      6. 学生t分布
      7. F分布
      8. 贝塔分布
      9. 威布尔分布
  9. 统计假设检验
    1. 统计检验的目的
    2. 使用的形式
    3. 不同类型的检验
    4. 单个均值的z检验
    5. 两个均值的z检验
    6. 单个均值的t检验
    7. 两个均值的t检验
    8. 配对t检验,用于比较均值
    9. 单因素方差分析F检验
    10. 单个比例的z检验
    11. 两个比例的z检验
    12. 在Microsoft Excel中检验比例A是否大于比例B
    13. 斯皮尔曼等级相关系数
    14. 皮尔森积矩相关系数
    15. 卡方检验
      1. 多个比例的卡方检验
      2. 列联表的卡方检验
    16. 分布的近似值
  10. 点估计100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 无偏性
    2. 优良性度量
    3. UMVUE
    4. 完备性
    5. 充分性和最小充分性
    6. 辅助性
  11. 练习题
    1. 汇总统计问题
    2. 数据展示问题
    3. 分布问题
    4. 数据检验问题
  12. 数值方法
    1. 基础线性代数和格拉姆-施密特正交化
    2. 无约束优化
    3. 分位数回归
    4. 统计软件的数值比较
    5. Excel 中的数值
    6. 统计/数值方法/随机数生成
  13. 时间序列分析
  14. 多元数据分析
    1. 主成分分析
    2. 度量数据的因子分析
    3. 序数数据的因子分析
    4. 典型相关分析
    5. 判别分析
  15. 特定数据集的分析
    1. 结核病分析
  16. 附录
    1. 作者
    2. 词汇表
    3. 索引
    4. 链接

编辑此框

抽样调查涉及从总体中选择和研究样本项目。样本只是从总体中选择的一组成员,而不是整个总体。对整个总体的调查称为**普查**。

总体样本可能无法给出准确的结果,但它有助于决策。

抽样调查的例子

  • 拨打当地电话簿中每一页上的第五个人,询问他们在这个地区的居住时间。(系统抽样)
  • 在田野的五个不同地方放置一个四边形,并计算四边形内的野花数量。(整群抽样)
  • 根据总体中的人口发生率选择子总体。例如,研究人员可能在总体中选择一个样本,该样本由30%的女性和70%的男性组成,并且总体中具有相同的性别比例。(分层抽样)
  • 选择一个国家中的几个城市,这些城市中的几个社区,以及这些社区中的几条街道,以招募调查参与者。(多阶段抽样)

术语“随机样本”用于指总体中每个项目都有同等机会被选中的样本。

虽然抽样是一种更具成本效益的确定结果的方法,但样本量小或依赖特定选择方法的样本会导致结果偏差。

以下是常见的偏差来源

  • 抽样偏差或统计偏差,其中某些人比其他人更容易被选中(例如,如果你给予城市同等的被选中机会而不是按大小加权)
  • 系统偏差,其中外部影响试图影响结果(例如,资助组织想要得到特定的结果)
华夏公益教科书