跳转到内容

概率/重要分布

来自维基教科书,开放的书籍,为开放的世界
(重定向自 概率:重要分布)

离散随机变量的分布

[编辑 | 编辑源代码]

初步概念:伯努利试验

[编辑 | 编辑源代码]

定义。(伯努利试验)伯努利试验是一种只有两个可能结果的实验,即成功和失败。

备注。

  • '成功'和'失败'仅作为标签,即我们可以将实验中的任意一个结果定义为'成功'。

定义。(伯努利试验的独立性)令为事件[1]。如果独立的,则相应的伯努利试验是独立的

示例。如果我们将抛硬币的结果解释为'正面朝上'和'反面朝上',则抛硬币是一个伯努利试验。

Clipboard

练习。

如果我们将抛硬币的结果解释为'正面朝上'、'反面朝上'和'硬币立起来',那么抛硬币是一个伯努利试验吗?

是。
否。



备注。

  • 我们通常将抛硬币的结果解释为'正面朝上'和'反面朝上'。

二项分布

[编辑 | 编辑源代码]

考虑个独立的伯努利试验,每个试验的成功概率为。我们希望计算概率

表示事件 ,如上一节所述。现在考虑一个特定的结果序列,其中在 次试验中有 次成功: 它的概率是 [2] 由于其他一些具有 次成功的序列在其他试验中出现的概率是 相同的,并且有 个不同的可能序列[3] 这是一个服从二项分布的随机变量的概率质量函数。

定义

[edit | edit source]

定义. (二项分布)

显示了 的概率质量函数。

一个随机变量 服从 二项分布,它有 次独立的伯努利试验,每次试验成功的概率为 ,记作 ,如果它的概率质量函数是

显示了 的累积分布函数。

备注。

  • 概率质量函数中的 "" 强调了分布的 参数(即描述分布的量)的值是 。我们也可以对概率密度函数使用类似的记号。
  • 还有一些其他方法来强调参数值。例如,当参数值为 时,概率密度函数/概率质量函数可以记作
  • 当然,这些内容并非概率密度函数/概率质量函数的必要组成部分,但它们可以使涉及的参数值更加明确和清晰。
  • 概率质量函数包含一个 二项式 系数,因此被称为 '二项分布'。
  • 每个分布的一般说明:
  • 我们也可以直接写下分布的记号来表示分布本身,例如 代表二项分布。
  • 为了简便起见,我们有时会说分布的 pmf、pdf 或支撑,指的是遵循该分布的随机变量的 pmf、pdf 或支撑(分别)。(这也适用于分布的其他性质(将在后面的章节中讨论),例如均值、方差等)。



伯努利分布

[编辑 | 编辑源代码]

伯努利分布只是二项式分布的一个特例,如下所示

定义.(伯努利分布)

的 pmf。

随机变量 遵循成功概率为 伯努利分布,表示为 ,如果其 pmf 为

的 cdf。

备注。

  • .
  • 这里只涉及一次伯努利试验,因此称为“伯努利分布”。

泊松分布

[编辑 | 编辑源代码]

泊松分布可以被视为二项式分布的“极限情况”。

考虑 个独立的伯努利试验,每次试验成功的概率为 。根据二项分布,

After that, consider an unit time interval, with (positive) occurrence rate of a rare event (i.e. the mean of number of occurrence of the rare event is ). We can divide the unit time interval to time subintervals of time length each. If is large and is relatively small, such that the probability for occurrence of two or more rare events at a single time interval is negligible, then the probability for occurrence of exactly one rare event for each time subinterval is by definition of mean. Then, we can view the unit time interval as a sequence of Bernoulli trials [4] with success probability . After that, we can use to model the number of occurrences of rare event. To be more precise, This is the pmf of a random variable following the Poisson distribution, and this result is known as the Poisson limit theorem (or law of rare events). We will introduce it formally after introducing the definition of Poisson distribution.

定义。 (泊松分布)

的概率质量函数。

一个随机变量 服从参数为正数 泊松分布,记为 ,如果它的概率质量函数为

的累积分布函数。

备注。

定理。(泊松极限定理)一个服从 分布收敛 于一个服从 的随机变量,当 .

证明。 该结果源于上面证明的结果: 的概率质量函数随着 趋近于 的概率质量函数。

备注。

  • 因此,对于较大的 和相对较小的 ,可以使用泊松分布来近似二项分布。


几何分布

[编辑 | 编辑源代码]

假设有一系列独立的伯努利试验,成功概率为。我们希望计算概率。通过考虑以下结果序列: 我们可以计算得到 [5] 这是遵循几何分布的随机变量的概率质量函数。

定义

[edit | edit source]

定义.(几何分布)

的概率质量函数。

如果随机变量 遵循 几何分布,且其 成功概率,记作 ,那么它的概率质量函数为

的累积分布函数。

备注。

  • 开始的概率序列,随着输入值 一次又一次地增加(即 )是一个 等比数列,因此得名 “几何 分布”。
  • 对于另一种定义,pmf 则为 ,这是概率 ,其支持为 .

命题。(几何分布的无记忆性)如果 ,则 对于每个 非负 整数 成立。

证明。

  • 特别地, 因为 .

备注。

  • 可以解释为'在第一次成功之前有超过 次失败'。
  • 可以解释为“ 次失败已经发生,所以第一次成功之前至少有 次失败”。
  • 这意味着条件 不会 影响第一次成功之前剩余失败次数的分布(它仍然遵循具有相同成功概率的几何分布)。
  • 因此,我们可以假设在发生失败的任意试验之后,试验从开始。
  • 例如,如果第一次试验失败,那么第一次成功之前剩余失败次数的分布不受影响。
  • 同样,如果第一次试验成功,那么条件变为,而不是,所以上述公式在这种情况下不适用。
  • 事实上,,因为给定 不能超过零。

负二项分布

[编辑 | 编辑源代码]

Consider a sequence of independent Bernoulli trials with success probability . We would like to calculate the probability . By considering this sequence of outcomes: we can calculate that Since the probability of other sequences with some of failures occuring in other trials (and some of successes (excluding the th success, which must occur in the last trial) occuring in other trials), is the same, and there are (or , which is the same numerically) distinct possible sequences [6], This is the pmf of a random variable following the negative binomial distribution.

定义. (负二项分布)

的概率质量函数。

一个随机变量 遵循 负二项分布,其 成功概率,记为 ,如果其概率质量函数(pmf)为

的累积分布函数(cdf)。

备注。

  • 负二项 系数参与其中,因此称为“负二项 分布”。


超几何分布

[编辑 | 编辑源代码]

考虑从一个大小为 的总体中,不放回地抽取大小为 的样本,该总体包含 个类型 1 的物体和 个其他类型的物体。那么, [7].

  • : 从 个(可区分的)类型 1 的对象中,无放回地选择 个对象的无序选择。
  • : 从 个(可区分的)其他类型的对象中,无放回地选择 个对象的无序选择。
  • : 从 个(可区分的)对象中,无放回地选择 个对象的无序选择。

这是遵循 超几何分布 的随机变量的概率质量函数。

定义

[edit | edit source]

定义。 (超几何分布)

的概率质量函数。

随机变量 服从 超几何分布,从包含 个类型 1 的对象和 个其他类型对象的集合中抽取 个对象,记为 ,如果它的概率质量函数是

的累积分布函数。

备注。

  • 概率质量函数有点类似于 超几何 级数 [8],因此得名 “超几何 分布”。


有限离散分布

[edit | edit source]

这种类型的分布是所有具有有限支撑的离散分布的推广,例如伯努利分布和超几何分布。

这种类型的分布的另一个特例是 离散均匀分布,它类似于 连续均匀分布(将在后面讨论)。

定义。 (有限离散分布)随机变量 遵循 有限离散分布,其向量为 ,概率向量为 ,表示为 ,如果其概率质量函数为

备注。

  • 对于均值和方差,我们可以直接根据定义进行计算。有限离散分布没有特殊的公式。

定义。 (离散均匀分布)离散均匀分布,表示为 ,是 .

备注。

  • 其概率质量函数为

示例。 假设随机变量 。那么, 概率质量函数的图形

|
|              *
|              |
|         *    |
|    *    |    |
|    |    |    |
*----*----*----*-------
     1    2    3

示例。 假设一个随机变量 . 那么, 概率质量函数的示例

|
|               
|               
|    *    *    *
|    |    |    |
|    |    |    |
*----*----*----*-------
     1    2    3
Clipboard

练习。

  

1 以下哪个分布应该用于模拟城镇每天发生的交通事故数量?

二项分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

2 在 200 人中,每个人独立地有 0.1 的概率是吸烟者。我们从他们中随机抽取一个人,直到抽到吸烟者为止。以下哪个分布应该用于模拟在抽到吸烟者之前需要的抽取次数?

二项分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

3 已知 1000 名出租车司机中,80% 的司机购买了某保险公司的保险。从他们中随机抽取 30 名出租车司机,不放回。以下哪个分布应该用于模拟抽取的未购买保险的司机人数?

二项分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

4 一家保险公司销售了 500 份保单。精算师确定,每份保单都有 0.1 的概率需要向被保险人支付索赔款,并且彼此独立。以下哪个分布应该用于模拟需要向被保险人支付索赔款的保单数量?

二项分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

5 一家保险公司销售了 500 份保单。精算师确定,每份保单都有 0.1 的概率需要向被保险人支付索赔款,并且彼此独立。以下哪个分布应该用于模拟在向被保险人支付了 10 次索赔款之前检查的保单数量?

二项分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

6 以下哪个分布应该用于模拟城镇中患有罕见疾病的人数?

二项分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

7 一个盒子里有 100 个红球,300 个蓝球和 250 个绿球。从盒子里抽取 100 个球。从盒子里抽取的非蓝球数量服从哪个分布?

8 以下哪个(些)分布恰好有两个参数?

二项分布。
伯努利分布。
泊松分布。
几何分布。
负二项分布。
超几何分布。

9 一家制造商销售了 200 个灯泡,每个灯泡售价 100 美元。制造商承诺,如果买家购买的灯泡在购买后的第一周内失效,将全额退款给买家。假设每个灯泡在第一周内失效的概率为 0.001,并且彼此独立,那么支付的退款数量服从哪个分布?


连续随机变量的分布

[编辑 | 编辑源代码]

均匀分布 (连续)

[编辑 | 编辑源代码]

连续均匀分布 是对“无偏好”的建模,即其支持域上所有相同长度的区间都是 等概率 [9] (可以从对应连续均匀分布的概率密度函数 (pdf) 中看出)。 此外还有 离散 均匀分布,但它不像 连续 均匀分布那么重要。因此,从现在开始,简称为“均匀分布”指的是 连续 均匀分布,而不是离散均匀分布。

定义。 (均匀分布)

的概率密度函数 (pdf)。

一个随机变量 遵循 均匀分布,记为 ,如果其概率密度函数 (pdf) 为

备注。

  • 的支持域也可以是 ,而不会影响事件的概率,因为使用 pdf 在 单个 点上计算的概率无论如何都是
  • 分布 标准均匀分布

命题。

的累积分布函数 (cdf)。

(均匀分布的累积分布函数) 的累积分布函数为

证明: 因此,结果成立。


指数分布

[edit | edit source]

具有速率参数 指数分布通常用于描述速率为 的罕见事件的到达间隔时间

将此与泊松分布进行比较,指数分布描述了罕见事件的到达间隔时间,而泊松分布描述了固定时间间隔内罕见事件的发生次数

根据速率的定义,当速率 时,到达间隔时间 (即罕见事件的频率)。

因此,我们希望当 (即 pdf 在较小的 处具有更高的值,当 )时,pdf 在包含较小 值的区间的面积

此外,由于在固定速率 下,到达时间间隔越长发生的可能性越小。因此,直观地,我们也希望 pdf 是一个严格的 递减 函数,这样发生的概率(pdf 在某个区间内的面积)

我们可以看到,指数分布的 pdf 满足这两个性质。

定义。(指数分布)

的 pdf。

一个随机变量 服从参数为正 速率 指数分布,记为 ,如果其 pdf 为

命题。(指数分布的 cdf)

的累积分布函数 (CDF)。

的累积分布函数 (CDF) 为

证明: 假设 的累积分布函数 (CDF) 为

命题。 (指数分布的无记忆性)如果 ,则 对每个 非负 成立。

证明。

备注。

  • 可以解释为“罕见事件将在接下来的 个时间单位内不会发生”;
  • 可以解释为“罕见事件在过去的 个时间单位内没有发生”。
  • 这意味着条件 不会影响 剩余 等待罕见事件的等待时间的分布(它仍然遵循具有相同参数的指数分布)。
  • 因此,我们可以假设事件的到达过程在观察的任意时间点 重新开始


伽马分布

[edit | edit source]

伽马 分布是广义的 指数 分布,从某种意义上说,我们也可以改变 形状指数 分布的 pdf。

定义。 (伽马分布)

的 PDF。

随机变量 服从 伽玛分布,其中 形状 参数为正数 速率 参数为正数 ,记为 ,如果其 PDF 为

的 CDF。

备注。

  • ,因为 的 PDF 为

这是 的 PDF。

贝塔分布

[edit | edit source]

贝塔 分布是 的推广,因为我们可以通过使用 两个形状参数 来改变 PDF 的 形状

定义。 (贝塔分布)

以下为 的 pdf 文件。

随机变量 服从 beta 分布,其正形状参数为 ,记为 ,如果其 pdf 为

以下为 的 cdf 文件。

备注。

  • ,因为 的 pdf 为

它是 的概率密度函数。

柯西分布

[edit | edit source]

柯西分布是 重尾 分布 [10]。因此,它是一个“病态”分布,因为它具有一些反直觉的性质,例如,尽管它的均值和方差从其图像直接看似乎是定义好的,但实际上它的均值和方差是未定义的。

定义。 (柯西分布)

概率密度函数累积分布函数

随机变量 服从 柯西分布,其 位置 参数为 ,记作 ,如果它的概率密度函数为

备注。

  • 这个定义指的是柯西分布的 特例。更准确地说,柯西分布的完整定义中还包含一个 尺度 参数,这里概率密度函数中的尺度参数被设置为 1。
  • 为了简化起见,这里采用此定义。
  • 由于 ,所以概率密度函数关于 对称。

正态分布(非常重要)

[edit | edit source]

正态分布或高斯分布是自然界中常见的现象,非常奇妙。这可能是因为根据 中心极限定理,样本均值或样本总和通常 近似 服从 正态 分布。因此,正态分布在统计学中非常重要。

定义。 (正态分布)

的 PDF 文件。

如果一个随机变量 服从 正态分布,其均值方差,记为 ,则其 PDF 为

的 CDF 文件。

备注。

  • 分布 标准 正态分布。
  • 对于 ,其 PDF 通常记为 ,其 CDF 通常记为
  • 为概率密度函数时,.
  • 因此, 的概率密度函数为 .
  • 我们将会证明 实际上是 均值,而 实际上是 方差.
  • 该概率密度函数关于 对称,因为 .

命题. (正态分布随机变量的线性变换分布) 如果 ,并且 是常数,那么 .

证明。 假设 [11]. 令 分别为 的累积分布函数。由于 通过微分, 这是 的概率密度函数。

备注。

  • 一个特殊情况是当 ,因为
  • ;
  • .
  • 这表明我们可以将每个服从正态分布的随机变量转换为服从标准正态分布的随机变量。
  • 这可以简化与正态分布随机变量相关的概率计算,因为我们有 标准正态分布表,其中给出了不同 的值。
  • 对于某些类型的标准正态分布表,只给出了不同 非负 的值。
  • 然后,我们可以使用以下公式计算不同负 下的值:

  • 此公式成立,因为


统计学中重要的分布,尤其是

[edit | edit source]

以下分布在统计学中尤为重要,它们都与正态分布相关。我们将简要介绍它们。

卡方分布

[编辑 | 编辑源代码]

卡方分布是伽马分布的一个特例,也与标准正态分布相关。

定义. (卡方分布)

的概率密度函数 .

具有正的自由度 的卡方分布,记为 ,是 的分布,其中 独立同分布,且它们都服从 .

的累积分布函数 .

备注。

  • 可以证明 ,因此 。(然后,我们可以通过这个推导出 的概率密度函数。)
  • 这意味着对于随机变量 .
  • 一个随机变量 遵循具有 个自由度的 卡方 分布,表示为 .

学生 t 分布

[编辑 | 编辑源代码]

学生 -分布卡方 分布和 正态 分布有关。

定义。(学生 -分布)

的 pdf .

具有 个自由度的 学生 -分布,表示为 ,是 的分布,其中 .

的累积分布函数。

备注。

  • 是扩展实数)。
  • 时,pdf 的尾部更重。
  • 一个随机变量 服从 (学生) -分布 ,自由度为 ,记为
  • 可以证明, 的pdf 为

F 分布是广义的学生 t 分布,因为它的参数比学生 t 分布多一个自由度。

定义. (-分布) 带有 个自由度的 -分布,记为 ,是 的分布,其中 .

的概率密度函数。
的累积分布函数。

备注。

  • .
  • 服从 -分布 的随机变量 ,其自由度分别为 ,记为 .
  • 可以证明, 的概率密度函数为

如果您想知道 卡方分布学生 -分布-分布 在统计学中的应用,可以参考 Statistics/Interval Estimation(置信区间构建中的应用)和 Statistics/Hypothesis Testing(假设检验中的应用)。

联合分布

[edit | edit source]

多项式分布

[edit | edit source]

动机

[edit | edit source]

多项式分布是 推广的 二项式分布,区别在于每次试验的结果不止两种。

假设有 个物体要分配到 个单元格中,每个物体独立分配到 一个且只有一个 单元格,分配到第 个单元格的概率为 () [12]。令 为分配到第 个单元格的物体数量。我们想计算概率 ,即第 个单元格有 个物体的概率。

我们可以将每次分配视为一个独立的试验,有 种结果(因为它可以分配到 个单元格中的一个且只有一个)。我们可以认识到,分配 个物体是将 个物体划分成 组。因此,有 种分配方式。

所以, 尤其,分配给个对象的概率个单元格是,这是由于独立性,因此分配给个对象到个单元格的特定情况的概率是,这是由于独立性。

定义

[edit | edit source]

定义。(多项式分布)随机向量 服从多项式分布,其中有次试验和概率向量,记为,如果它的联合概率质量函数为

备注。

  • 如果 .
  • 在这种情况下,如果 是二项分布的成功次数(而 是失败次数)。
  • 此外,。通过将对象分配到 个单元格中,并将每个单一对象的分配视为“成功”,可以看出这一点[13]。然后,成功概率是 .


多元正态分布

[edit | edit source]

多元 正态分布正如其名称所暗示的那样,是正态分布(单变量)的多变量(也是广义)版本。

Definition. (Multivariate normal distribution) A random vector follows the -dimensional normal distribution with mean vector and covariance matrix , denoted by [14] if its joint pdf is in which is the mean vector, and is the covariance matrix (with size ).

备注。

  • 对于 的情况,通常使用更常用的分布,称为 双变量正态 分布。
  • 另一种等效的定义是 如果

对于某些常数 ,而 个独立同分布的标准正态随机变量。
  • 利用上述结果,边际分布, 遵循 ,正如人们所期望的那样。
  • 根据关于独立正态随机变量之和和正态随机变量线性变换分布的命题(参见概率/随机变量变换章),均值为,方差为(根据定义,它等于)。

命题。(双变量正态分布的联合概率密度函数) 的联合概率密度函数为

其中 为正数。
双变量正态分布示例的图形

证明。对于双变量正态分布,

  • 均值向量
  • 协方差矩阵
  • 因此,

  • 由此可知,联合概率密度函数为


  1. 或者,我们可以将事件定义为
  2. 'indpt.' 代表独立。
  3. 这是因为从 次试验中(然后剩下的位置用于 '失败')对(可区分且有序的) 次试验进行无放回的无序选择,以获得 '成功'
  4. 罕见事件的发生被视为 '成功',罕见事件的未发生被视为 '失败'。
  5. 与二项分布的结果不同,每个 只有一个可能的序列。
  6. 次试验中对 次试验进行无放回的无序选择,以获得 '失败'(或对 次试验进行无放回的无序选择,以获得 '成功')。
  7. 的限制是为了定义二项式系数,即表达式 '有意义'。实际上,我们很少直接使用这个条件。相反,我们通常直接确定 的特定值是否 '有意义'。
  8. 这超出了本书的范围。
  9. 概率 '均匀分布在区间上'。
  10. 与其他 轻尾 分布(例如正态分布)相比,服从柯西 分布的随机变量有较高的概率取 极值。在图形上,pdf 的 '尾部'(即左端和右端)。
  11. 对于 的情况类似(不等号方向相反,最终我们将有两个负号相互抵消)。当 时,随机变量变成一个非随机常数,所以我们对这种情况不感兴趣。
  12. 然后,.
  13. 如果对象被分配到除 个单元以外的单元,那么它就是 '失败'。
  14. 的下标 是为了强调该分布是 维的,并且是可选的。
华夏公益教科书