跳到内容

R 编程/概率函数/二项式

来自维基教科书,开放的书籍,为开放的世界

二项分布

[编辑 | 编辑源代码]
  • N 个伯努利试验(所有试验都具有相同的成功概率)的总和
  • N 次抛掷可能不公平的硬币中正面出现的次数。
  • 在水样中真正存在的 N 个卵囊中,实际计数的个数,假设每个卵囊具有相同的回收概率。
  • 此分布具有 2 个参数(N 和 P),尽管我们通常知道试验次数(N),因此只有一个参数未知(P)。

概率质量函数

[编辑 | 编辑源代码]
  • dbinom(K,N,P),其中 K 是成功次数,N 是试验次数,P 是成功的概率。
  • dbinom(5,10,0.5) = 0.2460938
具有相同试验次数(10)但不同成功率(0.5 和 0.2)的二项式概率质量函数。

分布函数

[编辑 | 编辑源代码]
  • pbinom(K,N,P)
  • pbinom(5,10,0.5) = 0.6230469
N=10,P=0.2(蓝色)和 P=0.5(红色)。

生成随机变量

[编辑 | 编辑源代码]
  • rbinom(M,N,P)
  • rbinom(12,10,0.5) -> 5 5 7 5 5 6 7 6 6 6 4 7
  • hist(rbinom(1000,10,0.5)) --> 直方图
文件:Binom hist.JPG
1000 个二项式偏差样本,显示为直方图。
  • hist(rbinom(1000,10,0.5), breaks = seq(from=-0.5, to=12.5))将整数值放在条形图的中心(而不是条形图的右侧)。

参数估计

[编辑 | 编辑源代码]

大多数情况下,我们可以计算试验次数,因此该参数(N)是已知的。我们观察正值的个数(K),并利用这些信息来估计未观察到的“成功”概率(P)。

  • M 个二项式的总和与 M*N 个伯努利试验的总和相同 = binom(M*N,P)
  • 最大似然
    • lambda = sum(successes)/sum(trials) = sum(K)/sum(N)
  • 贝叶斯
    • 在均匀先验的情况下,后验是Beta(alpha=1+sum(K), beta=1+sum(N)-sum(K))
    • 在先验概率质量在 0 和 1 上,并将剩余质量分配给 Beta(1,1) 的情况下,请参阅抛硬币示例
文件:Beta1.JPG
来自 Mathcad 的图像
文件:Binom.jpg
来自 WinBUGS 的图像


  • 经典
    • 正态近似
    • 精确置信区间

但是,如果 M 个二项式试验的试验次数未知呢?我们可以使用数据 K[1] 到 K[M] 来估计 N 和 P 吗?

从重复的独立同分布二项式试验中估计两个参数

[编辑 | 编辑源代码]
华夏公益教科书