跳转到内容

统计学/简介/什么是统计学

来自维基教科书,开放的书籍,面向开放的世界

统计学


  1. 简介
    1. 什么是统计学?
    2. 现代统计学中的主题
    3. 为什么我应该学习统计学? 0% developed
    4. 学习统计学需要哪些知识?
  2. 不同类型的数据
    1. 原始数据和二手数据
    2. 定量数据和定性数据
  3. 数据收集方法
    1. 实验
    2. 抽样调查
    3. 观察研究
  4. 数据分析
    1. 数据清洗
    2. 移动平均
  5. 汇总统计量
    1. 集中趋势的度量
      1. 平均数、中位数和众数
      2. 几何平均数
      3. 调和平均数
      4. 算术平均数、几何平均数和调和平均数之间的关系
      5. 几何中位数
    2. 离散程度的度量
      1. 数据的范围
      2. 方差和标准差
      3. 四分位数和四分位数范围
      4. 分位数
  6. 显示数据
    1. 条形图
    2. 比较条形图
    3. 直方图
    4. 散点图
    5. 箱线图
    6. 饼图
    7. 比较饼图
    8. 象形图
    9. 折线图
    10. 频率多边形
  7. 概率
    1. 组合数学
    2. 伯努利试验
    3. 贝叶斯分析入门
  8. 分布
    1. 离散分布
      1. 均匀分布
      2. 伯努利分布
      3. 二项分布
      4. 泊松分布
      5. 几何分布
      6. 负二项分布
      7. 超几何分布
    2. 连续分布
      1. 均匀分布
      2. 指数分布
      3. 伽玛分布
      4. 正态分布
      5. 卡方分布
      6. 学生 t 分布
      7. F 分布
      8. 贝塔分布
      9. 威布尔分布
  9. 检验统计假设
    1. 统计检验的目的
    2. 使用的形式
    3. 不同类型的检验
    4. 单个均值的 z 检验
    5. 两个均值的 z 检验
    6. 单个均值的 t 检验
    7. 两个均值的 t 检验
    8. 比较均值的配对 t 检验
    9. 单因素方差分析 F 检验
    10. 单个比例的 z 检验
    11. 两个比例的 z 检验
    12. 在 Microsoft Excel 中检验比例 A 是否大于比例 B
    13. 斯皮尔曼等级相关系数
    14. 皮尔逊积矩相关系数
    15. 卡方检验
      1. 多个比例的卡方检验
      2. 列联表的卡方检验
    16. 分布的近似
  10. 点估计100% developed  as of 12:07, 28 March 2007 (UTC) (12:07, 28 March 2007 (UTC))
    1. 无偏性
    2. 优良性的度量
    3. UMVUE
    4. 完备性
    5. 充分性和最小充分性
    6. 辅助性
  11. 练习题
    1. 汇总统计量问题
    2. 数据显示问题
    3. 分布问题
    4. 数据检验问题
  12. 数值方法
    1. 基本线性代数和 Gram-Schmidt 正交化
    2. 无约束优化
    3. 分位数回归
    4. 统计软件的数值比较
    5. Excel 中的数值
    6. 统计学/数值方法/随机数生成
  13. 时间序列分析
  14. 多元数据分析
    1. 主成分分析
    2. 度量数据的因子分析
    3. 序数数据的因子分析
    4. 典型相关分析
    5. 判别分析
  15. 特定数据集的分析
    1. 结核病分析
  16. 附录
    1. 作者
    2. 词汇表
    3. 索引
    4. 链接

编辑此框

您的公司已经开发了一种可能治愈关节炎的新药。您将如何进行测试以确认该药物的有效性?

最新的销售数据刚刚发布,您的老板希望您为管理层准备一份关于公司可以改进业务的方面的报告。您应该寻找什么?您应该寻找什么?

你和一个朋友在看棒球比赛,他突然提出和你打赌,说两支球队在比赛中都不会打出本垒打。你应该接受这个赌局吗?

您想进行一项民意调查,询问您的学校是否应该使用资金建造一个新的运动综合体还是一个新的图书馆。您需要调查多少人?如何确保您的民意调查没有偏见?如何解读您的结果?

您工厂中的一台小部件制造机,通常每生产 100 个小部件就会损坏 4 个,最近开始每生产 100 个小部件就会损坏 5 个。什么时候需要购买新的制造机? (还有,什么是小部件?)

这些只是众多需要使用统计学的现实世界例子中的一部分。您将如何处理这些问题陈述?有一些人类的逐步算法,但是否存在一个通用的问题陈述?

  • “寻找可能的解决方案,决定一个解决方案,计划解决方案,实施解决方案,从结果中学习以供未来解决方案(或重新解决方案)。"
  • “SOAP - 主观 - 给定的问题,客观 - 经过检查后的问题,评估 - 定义更好的问题,计划 - 决定是否存在管理指南,并为这种情况制定解决方案蓝图,或生成一种风险最小化的全新解决方案路径”。
  • “HAMRC - 假设,目标,方法,结果,结论” - 认为没有真正差异的假设是零假设。

然后还有一个笑话比较了不同的思维方式

“一位物理学家、一位化学家和一位统计学家正在合作解决一个问题,这时废纸篓自燃了(他们都发誓他们已经戒烟了)。化学家说,'快,我们必须减少反应物氧气的浓度,通过增加非反应性气体(如二氧化碳和一氧化碳)的相对浓度。在火焰上放一个防火毯。'物理学家插话道,'不,不,我们必须减少用于激活燃烧的热量;拿一些水来浇灭火焰。'与此同时,统计学家正到处点火。其他人惊慌地问道,'你在做什么?'。'试图获得足够的样本量'。”

一般定义

[edit | edit source]

简而言之,统计学是对数据的研究。它包括描述性统计(研究收集数据的方法和工具,以及用于描述和解释数据的数学模型)和推断性统计(用于进行基于概率的决策和准确预测的系统和技术)。

词源

[edit | edit source]

顾名思义,统计学起源于“事物状态”的概念。这个词本身来自古拉丁语“statisticum collegium”,意思是“关于国家事务的讲座”。最终,它演变成意大利语“statista”,意思是“政治家”,以及德语“Statistik”,意思是“涉及国家的数据收集”。逐渐地,这个词开始用于描述任何类型数据的收集。

统计学作为数学的一个子集

[edit | edit source]

正如人们所期望的那样,统计学很大程度上以数学为基础,统计学的研究促成了数学中的许多重要概念:概率、分布、样本和总体、钟形曲线、估计和数据分析。

未来

[edit | edit source]

接下来,我们将学习现代统计学中的主题以及统计学的一些实际应用。我们还将介绍一些开始学习统计学所需的数学背景知识。

华夏公益教科书