概率密度函数
 红色曲线是标准正态分布
|
累积分布函数

|
符号 |
|
参数 |
μ ∈ R — 平均值 (位置) σ2 > 0 — 方差 (平方 尺度) |
支撑
|
x ∈ R |
PDF
|
|
CDF
|
|
平均值
|
μ
|
中位数
|
μ
|
众数
|
μ
|
方差
|
|
偏度
|
0
|
峰度
|
0
|
熵
|
|
MGF
|
|
CF
|
|
费舍尔信息
|
|
正态分布毫无疑问是最广泛使用的分布。它也称为高斯分布。它假设观测值集中在平均值μ附近,并且随着我们离平均值越来越远,这个值迅速衰减。传播的度量由方差
量化。
一些应用示例:
- 如果平均男性身高为175厘米,方差为6厘米,那么随机发现的男性身高为183厘米的概率是多少?
- 如果平均男性身高为175厘米,方差为6厘米,而平均女性身高为168厘米,方差为3厘米,那么平均男性身高低于平均女性身高的概率是多少?
- 如果假设罐头有4克的方差,那么平均重量需要是多少才能确保99%的罐头重量至少为250克?
密度函数是

其中
.
并且累积分布函数无法积分成单个表达式。
参数为 μ 和 σ 的正态分布记为
. 如果随机变量 X 服从期望值为 μ、标准差为 σ 的正态分布,则记为:
为了验证 f(x) 是否是一个有效的 pmf,我们必须验证 (1) 它在所有地方都非负,以及 (2) 它的总积分等于 1。第一个是显而易见的,因此我们继续验证第二个。

现在令
. 我们看到
.

现在我们使用 高斯积分,即 

我们推导出均值如下
![{\displaystyle \operatorname {E} [X]=\int _{-\infty }^{\infty }x\cdot f(x)dx}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1c925eb7f3d99af3083ee5838c3bec6f3838997a)

![{\displaystyle =\int _{-\infty }^{\infty }[(x-\mu )+\mu ]{\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-(x-\mu )^{2}/2\sigma ^{2}}dx}](https://wikimedia.org/api/rest_v1/media/math/render/svg/efc7a4e49f0658d302e610e2c327d9256056e798)


现在我们可以看到右边的积分是关于正态概率密度函数的完整积分。因此它等于 1。
![{\displaystyle \operatorname {E} [X]={\frac {1}{\sigma {\sqrt {2\pi }}}}(-\sigma ^{2})\left[e^{-(x-\mu )^{2}/2\sigma ^{2}}\right]_{-\infty }^{\infty }+\mu }](https://wikimedia.org/api/rest_v1/media/math/render/svg/199dfe628bd03625c353799d3dc9bbdd4ef62ee2)
![{\displaystyle ={\frac {1}{\sigma {\sqrt {2\pi }}}}(-\sigma ^{2})[0-0]+\mu }](https://wikimedia.org/api/rest_v1/media/math/render/svg/2ecc3da777cb4ce7e4e995d4dc314ea7800b64a2)

![{\displaystyle \operatorname {Var} (X)=\operatorname {E} [(X-{E}[X])^{2}]=\int _{-\infty }^{\infty }(x-\mu )^{2}\cdot f(x)dx=\int _{-\infty }^{\infty }(x-\mu )^{2}{\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-{\frac {1}{2}}\cdot \left({\frac {x-\mu }{\sigma }}\right)^{2}}dx}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e3bed0ee5839f63ce5208213bed008d13a57601)
我们令 

现在我们使用分部积分法,其中u=w且v=(-1/2)e^(-w^2)
![{\displaystyle \operatorname {Var} (X)={\frac {2\sigma ^{2}}{\sqrt {\pi }}}\left(\left[w{-1 \over 2}e^{-w^{2}}\right]_{-\infty }^{\infty }-\int _{-\infty }^{\infty }{-1 \over 2}e^{-w^{2}}dw\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3c19383f6494c4d4144cbd047b6d835b93033c2b)
我们可以看到,根据洛必达法则,括号内的项为零。

现在我们再次使用高斯积分
