当伯努利分布提出“单个事件是否会成功?”的问题时,二项式与“在给定次数的试验中,有多少次会成功?”的问题相关联。一些用二项式分布建模的示例问题包括
- 在十次抛掷中,硬币会落到正面多少次?
- 在某一天在某家医院出生的儿童中,有多少个是女孩?
- 在某个教室里,有多少个学生有绿色的眼睛?
- 在蜂群中,有多少只蚊子在喷洒杀虫剂后会死亡?
伯努利分布和二项式分布之间的关系是直观的:二项式分布是由多个伯努利试验组成的。我们进行
次重复实验,其中成功的概率由参数
给出,并将成功次数加起来。这个成功次数由随机变量 X 表示。X 的值介于 0 和
之间。
当随机变量 X 具有参数为
和
的二项式分布时,我们将其写为 X ~ Bin(n,p) 或 X ~ B(n,p),概率质量函数由以下方程给出
![{\displaystyle P\left[X=k\right]={\begin{cases}{n \choose k}p^{k}\left(1-p\right)^{n-k}\ &0\leq k\leq n\\0&{\mbox{otherwise}}\end{cases}}\quad 0\leq p\leq 1,\quad n\in \mathbb {N} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fdcd7b3068def867c9ff8b21538b9ab6cad87dc)
其中 
要复习阶乘 (n!),请返回本维基教科书前面部分的复习课程。
让我们通过一个简单的二项分布例子来了解它。我们将使用一些非常小的数字,因为阶乘计算起来很困难。我们将随机询问五个人是否相信外星生命的存在。在这个例子中,我们假设我们知道 30% 的人认为这是真的。我们想问的问题是:“有多少人会说他们相信外星生命?”实际上,我们想更具体一点:“**两个人说他们相信外星生命的概率是多少?**”
我们知道将要代入方程的所有值。被问的人数,n=5。任何特定的人回答“是”的概率,p=0.3。(记住,我说 30% 的人相信外星生命存在!)最后,我们想知道正好有 2 个人回答“是”的概率,所以 k=2。这将得到以下方程
因为 
以下是 X 所有可能值的概率。您可以通过将上面方程中的 k=2 替换为 0 到 5 之间的任何值来获得这些值。
k 的值 |
概率 f(k) |
0 |
0.16807
|
1 |
0.36015
|
2 |
0.30870
|
3 |
0.13230
|
4 |
0.02835
|
5 |
0.00243
|
从这些结果中我们可以学到什么?首先,我们会发现只有一个人的可能性略高于两个人承认相信外星生命存在。没有人相信它存在有明显的可能性(大约 17%),只有 0.24%(不到千分之二)的可能性是五个人都相信。
以上面这个例子为例。让我们逐个考虑五个人。
任何人相信外星生命存在的概率是 30%,即 0.3。因此,任何两个人都相信外星生命存在的概率是 0.3 的平方。类似地,任何人都不相信外星生命存在的概率是 70%,即 0.7,因此,任何三个都不相信外星生命存在的概率是 0.7 的立方。
现在,为了让五个人中有两个人相信外星生命存在,必须满足两个条件:两个人相信外星生命存在,三个人不相信。因此,五个人中有两个人相信外星生命存在的概率似乎是 0.3 的平方(两个相信者)乘以 0.7 的立方(三个不相信者),即 0.03087。
然而,在这样做时,我们只考虑了前两个被选中的人是相信者的情况。我们如何考虑第三个和第五个人是相信者的情况?这也会意味着五个人中总共有两个相信者。
答案在于组合学。考虑到五个人中前两个人相信外星生命存在的概率是 0.03087,我们注意到有 C(5,2),即 10 种方法可以从五个人中选出一组两个人,也就是说,有 10 种方法可以考虑五个人中的两个人是“前两个人”。这就是我们乘以 C(n,k) 的原因。五个人中任意两个人是相信者的概率是 0.03087 的十倍,即 0.3087。
平均值可以这样推导。
![{\displaystyle \operatorname {E} [X]=\sum _{i}f(x_{i})\cdot x_{i}=\sum _{x=0}^{n}{n \choose x}p^{x}\left(1-p\right)^{n-x}\cdot x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/25c14d7c93230e07fa765e5b066e733423288f60)
![{\displaystyle \operatorname {E} [X]=\sum _{x=0}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b68fb0a2115b2b88188f882d4827a75bd0f49441)
![{\displaystyle \operatorname {E} [X]={n! \over 0!(n-0)!}p^{0}\left(1-p\right)^{n-0}\cdot 0+\sum _{x=1}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77dea4fc65c59c164b5788edbc9284493b722a27)
![{\displaystyle \operatorname {E} [X]=0+\sum _{x=1}^{n}{n(n-1)! \over x(x-1)!(n-x)!}p\cdot p^{x-1}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1504d9928a9523e18659f92b1c2147519e289f9d)
![{\displaystyle \operatorname {E} [X]=np\sum _{x=1}^{n}{(n-1)! \over (x-1)!(n-x)!}p^{x-1}\left(1-p\right)^{n-x}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d12b43e256bb10979874f372a5559a56773a9b4e)
现在令 *w=x-1* 和 *m=n-1*。我们可以看到 *m-w=n-x*。现在我们可以将求和重写为
![{\displaystyle \operatorname {E} [X]=np\left[\sum _{w=0}^{m}{m! \over w!(m-w)!}p^{w}\left(1-p\right)^{m-w}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/023e3a02fb0f74ecc050e8a6ac6f99773f9dbd71)
现在我们可以看到,求和是在服从 Bin(m, p) 分布的二项式随机变量的完整概率质量函数上的求和。这等于 1(并且可以使用 二项式定理 轻松验证)。因此,我们有
![{\displaystyle \operatorname {E} [X]=np\left[1\right]=np}](https://wikimedia.org/api/rest_v1/media/math/render/svg/622190f9d3d351a6901c3eeec8f81c2e936ec495)
我们使用以下公式推导出方差
![{\displaystyle \operatorname {Var} [X]=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/39bfa72738f2149e732dfa85f4be9fcd52c38422)
我们已经计算了上面的 E[ *X*],所以现在我们将计算 E[ *X2*],然后回到这个方差公式
![{\displaystyle \operatorname {E} [X^{2}]=\sum _{i}f(x_{i})\cdot x^{2}=\sum _{x=0}^{n}x^{2}\cdot {n \choose x}p^{x}(1-p)^{n-x}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a813301bbd5190e14095a6656efcdb9f2962a141)
我们可以利用我们在推导均值时获得的经验。我们使用相同 *m* 和 *w* 的定义。
![{\displaystyle \operatorname {E} [X^{2}]=\sum _{x=0}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/df10a914655f7841e060bb9072bc71fbb4af6b72)
![{\displaystyle \operatorname {E} [X^{2}]=0+\sum _{x=1}^{n}{n! \over x!(n-x)!}p^{x}\left(1-p\right)^{n-x}x^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d0ef869b731e23896f03218e82c305d3db41917f)
![{\displaystyle \operatorname {E} [X^{2}]=np\sum _{x=1}^{n}{(n-1)! \over (x-1)!(n-x)!}p^{x-1}\left(1-p\right)^{n-x}x}](https://wikimedia.org/api/rest_v1/media/math/render/svg/35fb16618202ec081600966d99b8f1c2c6962c91)
![{\displaystyle \operatorname {E} [X^{2}]=np\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}(w+1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/19b17276a1cdd6a3f8569ed3bf01f6a1cfd13e5f)
![{\displaystyle \operatorname {E} [X^{2}]=np\left[\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}w+\sum _{w=0}^{m}{m \choose w}p^{w}\left(1-p\right)^{m-w}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ad5ddf55b6e8f72e5742e69fa83765614031db3d)
第一个和式与我们在均值(上文)中计算的和式形式相同。它加起来等于mp。第二个和式等于 1。
![{\displaystyle \operatorname {E} [X^{2}]=np\cdot (mp+1)=np((n-1)p+1)=np(np-p+1).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e118c6eaaae9f86b246c5bbb101cf50c31305519)
将此结果代入方差表达式,并结合均值(E(X) = np),得到
![{\displaystyle \operatorname {Var} (X)=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}=np(np-p+1)-(np)^{2}=np(1-p).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4f05a27ebd1225835ee614a1e94e5bd4e561f1b5)
- ↑ 25