泊松
概率质量函数
横轴是索引 *k*,即事件发生的次数。该函数仅在 *k* 的整数值上定义。连接线仅作为视觉参考。 |
累积分布函数
横轴是索引 *k*,即事件发生的次数。CDF 在 *k* 的整数值处不连续,而在其他地方则保持平坦,因为泊松分布的变量仅取整数值。 |
符号 |
|
参数 |
λ > 0 (实数) |
支持
|
k ∈ { 0, 1, 2, 3, ... } |
PMF
|
|
CDF
|
--或者-- (对于 其中 是 不完全伽玛函数 并且 是 地板函数)
|
均值
|
|
中位数
|
|
众数
|
|
方差
|
|
偏度
|
|
峰度
|
|
熵
|
(对于较大的)
|
矩生成函数 (MGF)
|
|
特征函数 (CF)
|
|
概率生成函数 (PGF)
|
|
任何法语使用者都会注意到 "Poisson" 的意思是 "鱼",但这与这种分布并没有什么关系。它实际上非常简单。这个名字来自数学家 西莫恩·德尼·泊松 (1781-1840)。
泊松分布与 二项分布 非常相似。我们正在考察事件发生的次数。区别很细微。二项分布考察的是在固定次数的试验中我们记录了多少次成功,而泊松分布测量的是在一段连续的空间或时间内,离散事件发生的次数。没有一个 "总" 值 n。与之前的部分一样,让我们来考察几个可能具有泊松性质的实验或问题。
- 我回家路上会遇到多少便士?
- 今天医院会出生多少个孩子?
- 今天喷了杀虫剂后,你被蚊子叮了多少次?
- 我在播放了一则特别令人反感的政治广告后,接到了多少个愤怒的电话?
- 播放新的电视广告后,我会卖出多少产品?
- 每小时有多少人会穿过警戒线进入我的商店?
- 今年将提交多少份外星人绑架报告?
- 每售出 100 米绳子会有多少个缺陷?
这个分布有点不同的是,用来计数事件数量的随机变量 X 可以取任何非负整数。换句话说,我回家后可能会发现街上没有便士。我也可能会发现一枚便士。也有可能(虽然不太可能,除非附近发生装甲车爆炸)我发现 10 个或 100 个或 10,000 个便士。
我们没有像伯努利分布和二项分布中的参数 p 那样代表一个组成概率,而是有一个参数 "lambda" 或 λ,它代表我们在实验中 "平均或预期" 发生的事件数量。泊松分布的概率质量函数由下式给出:
- .
我们经营一家餐厅,我们的招牌菜(非常昂贵)平均每天被点 4 次。明天这道菜被点 3 次的概率是多少?如果我们只有准备 3 道菜的食材,那么这道菜卖光的概率是多少,我们需要拒绝一些订单?
如果我们在上面的等式中设置 k=3,就可以得到这道菜恰好被点 3 次的概率。记住我们已经确定平均每天卖出 4 道菜,所以 λ=4。
以下是 k=0..6 所有值的概率表
k 的值 |
概率 f(k) |
0 |
0.0183
|
1 |
0.0733
|
2 |
0.1465
|
3 |
0.1954
|
4 |
0.1954
|
5 |
0.1563
|
6 |
0.1042
|
现在最大的问题是:我们明天结束营业前会卖光食物吗?换句话说,我们想知道随机变量 X 是否大于 3。为了计算这一点,我们需要将 X=4、X=5、X=6 ... 一直加到无穷大!但是等等,有一个更好的方法!
卖光食物的概率 P(X>3) 等于 1 减去我们没有卖光食物的概率,或者 1-P(X≤3)。所以如果我们把我们卖出零道菜、一道菜、两道菜和三道菜的概率加起来,然后从 1 中减去,我们就得到了答案。所以,
- 1 - P(X≤3) = 1 - ( P(X=0) + P(X=1) + P(X=2) + P(X=3) ) = 1 - 0.4335 = 0.5665
换句话说,我们有 56.65% 的机会卖光我们美味的招牌菜。我想我们只能祈祷了!
我们按以下方式计算平均值
请记住
我们使用以下公式推导出方差
我们已经计算了上面的 E[X],所以现在我们将计算 E[X2],然后回到这个方差公式。
- ....用 代替
第一个求和是 E[X]=λ,第二个我们也在上面计算过是 1。
回到方差公式,我们发现