跳转到内容

统计/分布/泊松

来自维基教科书,开放的书籍,开放的世界

泊松分布

[编辑 | 编辑源代码]
泊松
概率质量函数
Plot of the Poisson PMF
横轴是索引 *k*,即事件发生的次数。该函数仅在 *k* 的整数值上定义。连接线仅作为视觉参考。
累积分布函数
Plot of the Poisson CDF
横轴是索引 *k*,即事件发生的次数。CDF 在 *k* 的整数值处不连续,而在其他地方则保持平坦,因为泊松分布的变量仅取整数值。
符号
参数 λ > 0 (实数)
支持 k ∈ { 0, 1, 2, 3, ... }
PMF
CDF --或者--

(对于 其中 不完全伽玛函数 并且 地板函数)

均值
中位数
众数
方差
偏度
峰度

(对于较大的)
                   

矩生成函数 (MGF)
特征函数 (CF)
概率生成函数 (PGF)

任何法语使用者都会注意到 "Poisson" 的意思是 "鱼",但这与这种分布并没有什么关系。它实际上非常简单。这个名字来自数学家 西莫恩·德尼·泊松 (1781-1840)。

泊松分布与 二项分布 非常相似。我们正在考察事件发生的次数。区别很细微。二项分布考察的是在固定次数的试验中我们记录了多少次成功,而泊松分布测量的是在一段连续的空间或时间内,离散事件发生的次数。没有一个 "总" 值 n。与之前的部分一样,让我们来考察几个可能具有泊松性质的实验或问题。

  • 我回家路上会遇到多少便士?
  • 今天医院会出生多少个孩子?
  • 今天喷了杀虫剂后,你被蚊子叮了多少次?
  • 我在播放了一则特别令人反感的政治广告后,接到了多少个愤怒的电话?
  • 播放新的电视广告后,我会卖出多少产品?
  • 每小时有多少人会穿过警戒线进入我的商店?
  • 今年将提交多少份外星人绑架报告?
  • 每售出 100 米绳子会有多少个缺陷?

这个分布有点不同的是,用来计数事件数量的随机变量 X 可以取任何非负整数。换句话说,我回家后可能会发现街上没有便士。我也可能会发现一枚便士。也有可能(虽然不太可能,除非附近发生装甲车爆炸)我发现 10 个或 100 个或 10,000 个便士。

我们没有像伯努利分布和二项分布中的参数 p 那样代表一个组成概率,而是有一个参数 "lambda" 或 λ,它代表我们在实验中 "平均或预期" 发生的事件数量。泊松分布的概率质量函数由下式给出:

.

一个例子

[编辑 | 编辑源代码]

我们经营一家餐厅,我们的招牌菜(非常昂贵)平均每天被点 4 次。明天这道菜被点 3 次的概率是多少?如果我们只有准备 3 道菜的食材,那么这道菜卖光的概率是多少,我们需要拒绝一些订单?

如果我们在上面的等式中设置 k=3,就可以得到这道菜恰好被点 3 次的概率。记住我们已经确定平均每天卖出 4 道菜,所以 λ=4。

以下是 k=0..6 所有值的概率表

k 的值 概率 f(k)
0 0.0183
1 0.0733
2 0.1465
3 0.1954
4 0.1954
5 0.1563
6 0.1042

现在最大的问题是:我们明天结束营业前会卖光食物吗?换句话说,我们想知道随机变量 X 是否大于 3。为了计算这一点,我们需要将 X=4、X=5、X=6 ... 一直加到无穷大!但是等等,有一个更好的方法!

卖光食物的概率 P(X>3) 等于 1 减去我们没有卖光食物的概率,或者 1-P(X≤3)。所以如果我们把我们卖出零道菜、一道菜、两道菜和三道菜的概率加起来,然后从 1 中减去,我们就得到了答案。所以,

1 - P(X≤3) = 1 - ( P(X=0) + P(X=1) + P(X=2) + P(X=3) ) = 1 - 0.4335 = 0.5665

换句话说,我们有 56.65% 的机会卖光我们美味的招牌菜。我想我们只能祈祷了!

均值

[edit | edit source]

我们按以下方式计算平均值

请记住

方差

[edit | edit source]

我们使用以下公式推导出方差

我们已经计算了上面的 E[X],所以现在我们将计算 E[X2],然后回到这个方差公式。

....用 代替

第一个求和是 E[X]=λ,第二个我们也在上面计算过是 1。

回到方差公式,我们发现

[edit | edit source]
华夏公益教科书