超几何分布
概率质量函数
|
累积分布函数
|
符号 |
|
参数 |
|
支持
|
|
PMF
|
|
CDF
|
其中 是 广义超几何函数 |
期望值
|
|
中位数
|
模式 = |
方差
|
|
偏度
|
|
峰度
|
|
熵
|
???
|
矩生成函数
|
|
特征函数
|
|
超几何分布描述了从包含 *m* 个成功的总体中,不放回地抽取 *n* 次后,成功次数的分布情况。
它的概率质量函数为
从技术上讲,函数的支持范围仅在 *x∈[max(0, n+m-N), min(m, n)]* 处。在该范围不为 *[0,n]* 的情况下,*f(x)=0*,因为对于 *k>0*,.
我们首先检查 *f(x)* 是否是一个有效的概率质量函数。这要求它在任何地方都非负,并且它的总和等于 1。第一个条件是显而易见的。对于第二个条件,我们将从 范德蒙德恒等式 开始
现在我们看到,如果 *a=m* 并且 *b=N-m*,那么条件就满足了。
我们推导出平均值如下
我们使用恒等式 在分母中。
接下来我们使用恒等式 在分子中的第一个二项式中。
接下来,对于和式中的变量,我们定义相应的比它们少一的素变量。所以 N′=N−1, m′=m−1, x′=x−1, n′=n-1.
现在我们看到,这个和式是关于修改参数的超几何分布pmf的总和。它等于1。因此
我们首先确定 E(X2).
我们使用与推导均值时相同的变量替换。
第一个求和是具有参数 (n',m',N') 的超几何随机变量的期望值。第二个求和是该随机变量的概率质量函数的总和。
然后我们求解方差
或者等效地,