统计/分布/泊松

泊松
	概率质量函数; ; 横轴是索引 k，即事件发生的次数。该函数仅在 k 的整数值上定义。连接线仅作为视觉参考。
	累积分布函数; ; 横轴是索引 k，即事件发生的次数。CDF 在 k 的整数值处不连续，而在其他地方则保持平坦，因为泊松分布的变量仅取整数值。
符号
参数	λ > 0 (实数)
支持	k ∈ { 0, 1, 2, 3, ... }
PMF
CDF	--或者-- (对于其中是不完全伽玛函数并且是地板函数)
均值
中位数
众数
方差
偏度
峰度
熵	(对于较大的) ;
矩生成函数 (MGF)
特征函数 (CF)
概率生成函数 (PGF)

任何法语使用者都会注意到 "Poisson" 的意思是 "鱼"，但这与这种分布并没有什么关系。它实际上非常简单。这个名字来自数学家西莫恩·德尼·泊松 (1781-1840)。

泊松分布与二项分布非常相似。我们正在考察事件发生的次数。区别很细微。二项分布考察的是在固定次数的试验中我们记录了多少次成功，而泊松分布测量的是在一段连续的空间或时间内，离散事件发生的次数。没有一个 "总" 值 n。与之前的部分一样，让我们来考察几个可能具有泊松性质的实验或问题。

这个分布有点不同的是，用来计数事件数量的随机变量 X 可以取任何非负整数。换句话说，我回家后可能会发现街上没有便士。我也可能会发现一枚便士。也有可能（虽然不太可能，除非附近发生装甲车爆炸）我发现 10 个或 100 个或 10,000 个便士。

我们没有像伯努利分布和二项分布中的参数 p 那样代表一个组成概率，而是有一个参数 "lambda" 或 λ，它代表我们在实验中 "平均或预期" 发生的事件数量。泊松分布的概率质量函数由下式给出：

P(N=k)={\frac {e^{-\lambda }\lambda ^{k}}{k!}}

.

我们经营一家餐厅，我们的招牌菜（非常昂贵）平均每天被点 4 次。明天这道菜被点 3 次的概率是多少？如果我们只有准备 3 道菜的食材，那么这道菜卖光的概率是多少，我们需要拒绝一些订单？

如果我们在上面的等式中设置 k=3，就可以得到这道菜恰好被点 3 次的概率。记住我们已经确定平均每天卖出 4 道菜，所以 λ=4。

P(N=k)={\frac {e^{-\lambda }\lambda ^{k}}{k!}}={\frac {e^{-4}4^{3}}{3!}}=0.195

以下是 k=0..6 所有值的概率表

现在最大的问题是：我们明天结束营业前会卖光食物吗？换句话说，我们想知道随机变量 X 是否大于 3。为了计算这一点，我们需要将 X=4、X=5、X=6 ... 一直加到无穷大！但是等等，有一个更好的方法！

卖光食物的概率 P(X>3) 等于 1 减去我们没有卖光食物的概率，或者 1-P(X≤3)。所以如果我们把我们卖出零道菜、一道菜、两道菜和三道菜的概率加起来，然后从 1 中减去，我们就得到了答案。所以，

1 - P(X≤3) = 1 - ( P(X=0) + P(X=1) + P(X=2) + P(X=3) ) = 1 - 0.4335 = 0.5665

换句话说，我们有 56.65% 的机会卖光我们美味的招牌菜。我想我们只能祈祷了！

我们按以下方式计算平均值

\operatorname {E} [X]=\sum _{i}f(x_{i})\cdot x_{i}=\sum _{x=0}^{\infty }{\frac {e^{-\lambda }\lambda ^{x}}{x!}}x

\operatorname {E} [X]={\frac {e^{-\lambda }\lambda ^{0}}{0!}}\cdot 0+\sum _{x=1}^{\infty }{\frac {e^{-\lambda }\lambda ^{x}}{x!}}x

\operatorname {E} [X]=0+e^{-\lambda }\sum _{x=1}^{\infty }{\frac {\lambda \lambda ^{x-1}}{(x-1)!}}

\operatorname {E} [X]=\lambda e^{-\lambda }\sum _{x=1}^{\infty }{\frac {\lambda ^{x-1}}{(x-1)!}}

\operatorname {E} [X]=\lambda e^{-\lambda }\sum _{x=0}^{\infty }{\frac {\lambda ^{x}}{x!}}

请记住 $\mathrm {e} ^{\lambda }=\sum _{x=0}^{\infty }{\frac {\lambda ^{x}}{x!}}$

\operatorname {E} [X]=\lambda e^{-\lambda }e^{\lambda }=\lambda

我们使用以下公式推导出方差

\operatorname {Var} [X]=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}

我们已经计算了上面的 E[X]，所以现在我们将计算 E[X²]，然后回到这个方差公式。

\operatorname {E} [X^{2}]=\sum _{i}f(x_{i})\cdot x^{2}

\operatorname {E} [X^{2}]=\sum _{x=0}^{\infty }{\frac {e^{-\lambda }\lambda ^{x}}{x!}}x^{2}

\operatorname {E} [X^{2}]=0+\sum _{x=1}^{\infty }{\frac {e^{-\lambda }\lambda \lambda ^{x-1}}{(x-1)!}}x

\operatorname {E} [X^{2}]=\lambda \sum _{x=0}^{\infty }{\frac {e^{-\lambda }\lambda ^{x}}{x!}}(x+1)

....用

x+1

代替

x

\operatorname {E} [X^{2}]=\lambda \left[\sum _{x=0}^{\infty }{\frac {e^{-\lambda }\lambda ^{x}}{x!}}x+\sum _{x=0}^{\infty }{\frac {e^{-\lambda }\lambda ^{x}}{x!}}\right]

第一个求和是 E[X]=λ，第二个我们也在上面计算过是 1。

\operatorname {E} [X^{2}]=\lambda \left[\lambda +1\right]=\lambda ^{2}+\lambda

回到方差公式，我们发现

\operatorname {Var} [X]=(\lambda ^{2}+\lambda )-(\lambda )^{2}=\lambda

泊松
概率质量函数横轴是索引 k，即事件发生的次数。该函数仅在 k 的整数值上定义。连接线仅作为视觉参考。
累积分布函数横轴是索引 k，即事件发生的次数。CDF 在 k 的整数值处不连续，而在其他地方则保持平坦，因为泊松分布的变量仅取整数值。
符号	$\mathrm {Pois} (\lambda )\,$
参数	λ > 0 (实数)
支持	k ∈ { 0, 1, 2, 3, ... }
PMF	${\frac {\lambda ^{k}}{k!}}\cdot e^{-\lambda }$
CDF	${\frac {\Gamma (\lfloor k+1\rfloor ,\lambda )}{\lfloor k\rfloor !}}\!$ --或者-- $e^{-\lambda }\sum _{i=0}^{\lfloor k\rfloor }{\frac {\lambda ^{i}}{i!}}\$ (对于 $k\geq 0$ 其中 $\Gamma (x,y)\,\!$ 是不完全伽玛函数并且 $\lfloor k\rfloor$ 是地板函数)
均值	$\lambda \,\!$
中位数	$\approx \lfloor \lambda +1/3-0.02/\lambda \rfloor$
众数	$\lfloor \lambda \rfloor ,\,\lceil \lambda \rceil -1$
方差	$\lambda \,\!$
偏度	$\lambda ^{-1/2}\,$
峰度	$\lambda ^{-1}\,$
熵	$\lambda [1\!-\!\log(\lambda )]\!+\!e^{-\lambda }\sum _{k=0}^{\infty }{\frac {\lambda ^{k}\log(k!)}{k!}}$ (对于较大的 $\lambda$ ) ${\frac {1}{2}}\log(2\pi e\lambda )-{\frac {1}{12\lambda }}-{\frac {1}{24\lambda ^{2}}}-$ ${\frac {19}{360\lambda ^{3}}}+O({\frac {1}{\lambda ^{4}}})$
矩生成函数 (MGF)	$\exp(\lambda (e^{t}-1))\,$
特征函数 (CF)	$\exp(\lambda (e^{it}-1))\,$
概率生成函数 (PGF)	$\exp(\lambda (z-1))\,$