跳转至内容

统计学/不同类型的数据/PS

来自维基教科书,开放的书籍,开放的世界

统计学


  1. 介绍
    1. 什么是统计学?
    2. 现代统计学中的主题
    3. 为什么要学习统计学? 0% developed
    4. 我需要知道什么才能学习统计学?
  2. 不同类型的数据
    1. 原始数据和次要数据
    2. 定量数据和定性数据
  3. 数据收集方法
    1. 实验
    2. 抽样调查
    3. 观察性研究
  4. 数据分析
    1. 数据清洗
    2. 移动平均
  5. 汇总统计
    1. 集中趋势的度量
      1. 平均数、中位数和众数
      2. 几何平均数
      3. 调和平均数
      4. 算术、几何和调和平均数之间的关系
      5. 几何中位数
    2. 离散度的度量
      1. 数据的范围
      2. 方差和标准差
      3. 四分位数和四分位数范围
      4. 分位数
  6. 数据展示
    1. 条形图
    2. 比较条形图
    3. 直方图
    4. 散点图
    5. 箱线图
    6. 饼图
    7. 比较饼图
    8. 象形图
    9. 折线图
    10. 频率多边形
  7. 概率
    1. 组合学
    2. 伯努利试验
    3. 贝叶斯分析入门
  8. 分布
    1. 离散分布
      1. 均匀分布
      2. 伯努利分布
      3. 二项分布
      4. 泊松分布
      5. 几何分布
      6. 负二项分布
      7. 超几何分布
    2. 连续分布
      1. 均匀分布
      2. 指数分布
      3. 伽马分布
      4. 正态分布
      5. 卡方分布
      6. 学生t分布
      7. F分布
      8. 贝塔分布
      9. 威布尔分布
  9. 统计假设检验
    1. 统计检验的目的
    2. 使用的形式主义
    3. 不同类型的检验
    4. 单个均值的z检验
    5. 两个均值的z检验
    6. 单个均值的t检验
    7. 两个均值的t检验
    8. 配对t检验比较均值
    9. 单因素方差分析F检验
    10. 单个比例的z检验
    11. 两个比例的z检验
    12. 在Microsoft Excel中测试比例A是否大于比例B
    13. 斯皮尔曼等级相关系数
    14. 皮尔逊积矩相关系数
    15. 卡方检验
      1. 多个比例的卡方检验
      2. 列联表的卡方检验
    16. 分布的近似
  10. 点估计100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 无偏性
    2. 优良性的度量
    3. UMVUE
    4. 完备性
    5. 充分性和最小充分性
    6. 辅助性
  11. 练习题
    1. 汇总统计问题
    2. 数据展示问题
    3. 分布问题
    4. 数据检验问题
  12. 数值方法
    1. 基础线性代数和格拉姆-施密特正交化
    2. 无约束优化
    3. 分位数回归
    4. 统计软件的数值比较
    5. Excel中的数值
    6. 统计学/数值方法/随机数生成
  13. 时间序列分析
  14. 多元数据分析
    1. 主成分分析
    2. 度量数据的因子分析
    3. 序数据的因子分析
    4. 典型相关分析
    5. 判别分析
  15. 特定数据集的分析
    1. 结核病分析
  16. 附录
    1. 作者
    2. 词汇表
    3. 索引
    4. 链接

编辑此框


统计数据可以从两个来源获得,主要次要

原始数据

[编辑 | 编辑源代码]

原始数据是指专门为特定目的而收集的原始数据。这意味着有人首先从原始来源收集了数据。以这种方式收集的数据称为原始数据。

收集原始数据的人可能是授权机构、调查员、统计员,或者他们可能只是一个拿着剪贴板的人。收集原始数据的人可能了解该研究,并且可能被激励使该研究取得成功。这些人充当证人,因此原始数据的可靠性仅限于收集数据的人。

收集这种数据的研究被称为实地研究.

例如:您自己的问卷。

次要数据

[编辑 | 编辑源代码]

次要数据是指为了其他目的而收集的数据。当我们使用统计方法将来自其他目的的原始数据用于我们的目的时,我们称之为次要数据。这意味着一个目的的原始数据是另一个目的的次要数据。次要数据是重复使用的数据。通常是在不同的上下文中。

收集这种数据的研究被称为桌面研究.

例如:来自书籍的数据。

为什么要这样分类数据?

[编辑 | 编辑源代码]

了解数据的收集方式可以让研究的批评者寻找研究进行过程中的偏差。一项好的研究将欢迎这种审查。每种类型都有自己的弱点和优势。原始数据是由直接关注特定目的的人收集的。这有助于确保问题对目的有意义,但也可能在这些相同的问题中引入偏差。次要数据没有这种关注的优势,但只能受到重复使用的数据选择中引入的偏差的影响。换句话说,收集次要数据的人可以选择问题。收集原始数据的人可以写问题。

<< 数据来源 | 统计学 | >> 定量和定性数据

华夏公益教科书