跳转到内容

统计学/概率论/贝叶斯

来自Wikibooks,开放世界的开放书籍

统计学


  1. 绪论
    1. 什么是统计学?
    2. 现代统计学中的主题
    3. 为什么我应该学习统计学? 0% developed
    4. 学习统计学需要具备哪些知识?
  2. 不同类型的数据
    1. 原始数据和二手数据
    2. 定量数据和定性数据
  3. 数据收集方法
    1. 实验
    2. 抽样调查
    3. 观察性研究
  4. 数据分析
    1. 数据清洗
    2. 移动平均
  5. 汇总统计量
    1. 集中趋势度量
      1. 均值、中位数和众数
      2. 几何平均数
      3. 调和平均数
      4. 算术平均数、几何平均数和调和平均数之间的关系
      5. 几何中位数
    2. 离散程度度量
      1. 数据的范围
      2. 方差和标准差
      3. 四分位数和四分位数间距
      4. 分位数
  6. 数据展示
    1. 条形图
    2. 比较条形图
    3. 直方图
    4. 散点图
    5. 箱线图
    6. 饼图
    7. 比较饼图
    8. 象形图
    9. 折线图
    10. 频数多边形
  7. 概率论
    1. 组合数学
    2. 伯努利试验
    3. 贝叶斯分析入门
  8. 分布
    1. 离散分布
      1. 均匀分布
      2. 伯努利分布
      3. 二项分布
      4. 泊松分布
      5. 几何分布
      6. 负二项分布
      7. 超几何分布
    2. 连续分布
      1. 均匀分布
      2. 指数分布
      3. 伽马分布
      4. 正态分布
      5. 卡方分布
      6. 学生t分布
      7. F分布
      8. 贝塔分布
      9. 威布尔分布
  9. 统计假设检验
    1. 统计检验的目的
    2. 使用的形式化
    3. 不同类型的检验
    4. 单样本均值z检验
    5. 双样本均值z检验
    6. 单样本均值t检验
    7. 双样本均值t检验
    8. 配对样本t检验比较均值
    9. 单因素方差分析F检验
    10. 单样本比例z检验
    11. 双样本比例z检验
    12. 在Microsoft Excel中检验比例A是否大于比例B
    13. 斯皮尔曼等级相关系数
    14. 皮尔逊积矩相关系数
    15. 卡方检验
      1. 多样本比例的卡方检验
      2. 列联表的卡方检验
    16. 分布的近似
  10. 点估计100% developed  as of 12:07, 28 March 2007 (UTC) (2007年3月28日 (UTC)12:07)
    1. 无偏性
    2. 优良性度量
    3. 一致最小方差无偏估计
    4. 完备性
    5. 充分性和最小充分性
    6. 辅助性
  11. 练习题
    1. 汇总统计量问题
    2. 数据展示问题
    3. 分布问题
    4. 数据检验问题
  12. 数值方法
    1. 基础线性代数和格拉姆-施密特正交化
    2. 无约束优化
    3. 分位数回归
    4. 统计软件的数值比较
    5. Excel中的数值计算
    6. 统计学/数值方法/随机数生成
  13. 时间序列分析
  14. 多元数据分析
    1. 主成分分析
    2. 度量数据的因子分析
    3. 有序数据的因子分析
    4. 典型相关分析
    5. 判别分析
  15. 特定数据集的分析
    1. 结核病的分析
  16. 附录
    1. 作者
    2. 词汇表
    3. 索引
    4. 链接

编辑此框

贝叶斯分析是统计学的一个分支,其基础思想是我们事先对感兴趣的概率有一些了解,这些概率被称为先验概率。这可能是您对特定事件的信念程度、先前研究的结果,或概率的一般商定起始值。“贝叶斯”一词来源于贝叶斯规则或定律,这是关于条件概率的一个定律。“贝叶斯”的对立面有时被称为“频率统计”。

考虑一个装有3枚硬币的盒子,它们正面朝上的概率分别为1/4、1/2和3/4。我们任意选择其中一枚硬币。因此,我们将1/3作为先验概率,表示选择了第1枚硬币。经过5次抛掷,其中X=4次正面朝上,似乎不太可能是第1枚硬币。我们计算第1枚硬币的后验概率,如下所示:

用文字描述

已知抛掷五次硬币的结果为四次正面,则硬币为第一枚硬币的概率……等于已知硬币为第一枚硬币的情况下,抛掷五次硬币出现四次正面的概率,乘以硬币为第一枚硬币的概率。所有这些都除以抛掷五次硬币出现四次正面的概率(不考虑选择哪枚硬币)。二项式系数以及所有分母在将1/2扩展到2/4时都会抵消。这将得到

同样地,我们发现

以及

.

这表明,在检查了五次抛掷的结果后,我们最有可能选择了第三枚硬币。

实际上,对于给定的结果,分母并不重要,只有相对概率 当结果为三次正面时,概率会倾向于第二枚硬币,并且如下表所示,概率会进一步发生变化。

正面次数
5 1 32 243
4 3 32 81
3 9 32 27
2 27 32 9
1 81 32 3
0 243 32 1
华夏公益教科书