跳转至内容

概率/条件分布

来自维基教科书,开放的书籍,开放的世界



假设发生了一场地震。令 为伤亡人数, 为地震的里氏震级

(a) 在没有给定任何信息的情况下, 的分布是什么?

(b) 假设 的分布是什么?

(c) 假设 的分布是什么?

备注。

  • 表示地震微弱, 表示地震强烈。

你对 (a)、(b)、(c) 的答案是否不同?

在 (b) 和 (c) 中,我们分别有 条件 分布 在给定 时的分布,以及 条件 分布 在给定 时的分布。

一般情况下,我们有给定 条件分布 (观察 的值 之前 ),或者给定 (观察 的值 之后 )。

条件分布

[编辑 | 编辑源代码]

回顾条件概率的定义: 其中 是事件,且。将此定义应用于离散随机变量 ,我们有 其中 的联合 pmf,而 的边际 pmf。很自然地,我们将这种条件概率称为条件 pmf,对吧?我们将这种条件概率记为。那么,这基本上就是条件 pmf 的定义: 在给定 条件下的条件 pmf 是条件概率。自然地,我们希望条件 pdf 的定义也类似。事实确实如此。

定义。(条件概率函数)设 是两个随机变量,它们都是离散的或都是连续的。 条件 概率(质量或密度)函数为 在给定 的情况下,其中 是一个实数,是

备注。

  • 边缘 pdf 可以被解释为 归一化 常数,它使积分 ,因为 (在 固定为 的区域上积分(满足条件的区域),因此我们只在 的对应区间上积分 ( 仍然是一个变量))。
  • 这类似于条件概率定义中的分母,它使整个样本空间的条件概率等于 1,以满足概率公理。

为了更直观地理解连续情况下的定义,请考虑以下图表。

Top view:
     
        |
        |
        *---------------* 
        |               |
        |               |
fixed y *===============* <--- corresponding interval
        |               |
        |               |
        *---------------*
        |
        *---------------- x

Side view:

          *  
         / \ 
        *\  *  /                                           
       /|#\   \
   |  / |##\ / *---------*
   | *  |###\            /\
   | |\ |##/#\----------/--\     
   | | \|#/###*--------*   /                             
   | |  \/############/#\ /                              
   | |y *\===========/===*                               
   | | /  *---------*   /                                
   | |/              \ /                                 
   | *----------------*                                  
   |/                                                    
   *------------------------- x                          


Front view:
             
    |
    |
    |               
    *\     
    |#\    
    |##\   
    |###\             
    |####\   <------ Area: f_Y(y)
    |#####*--------*  
    |###############\ 
    *================*-------------- x

*---*
|###| : corresponding cross section from joint pdf
*---*   

我们可以看到,当我们对 进行条件化时,我们从联合概率密度函数下的区域中“切”出一片,这片“切片”的面积就是 单变量 联合概率密度函数 在固定 且变量 时,与 轴之间的面积。由于面积由 给出,而根据概率公理,面积应该等于 1。因此,我们通过将单变量联合概率密度函数 除以 来缩小“切片”面积的 倍。之后,缩小“切片”顶部的那条曲线就是条件概率密度函数 的图像。

现在,我们已经讨论了两个随机变量都是离散或连续的情况。那么其中一个变量是离散,另一个是连续的情况呢?在这种情况下,这两个随机变量没有“联合概率函数”,因为一个是离散的,另一个是连续的!但是,我们仍然可以通过其他方式定义条件概率函数。为了引出下面的定义,设 是条件概率 。然后,对 关于 求导应该得到条件pdf 。所以,我们有 因此,自然地给出以下定义。

定义。(当 是连续的,而 是离散的)条件概率密度函数)令 为一个连续随机变量,而 为一个离散随机变量。条件概率密度函数 给定 ,其中 是一个实数,是

现在,我们来讨论一下当 是离散的而 是连续的情况。在这种情况下,我们使用上述定义作为定义的动机。然而,我们应该交换 的位置,以确保假设仍然成立。然后,我们得到 在这种情况下, 是离散的,因此很自然地将给定 的条件概率质量函数定义为 在表达式中。现在,在重新排列项之后,我们得到 因此,我们有以下定义。

定义。(当 为离散且 为连续时的条件概率质量函数)令 为一个离散随机变量,而 为一个连续随机变量。 在给定 (其中 为实数)的条件概率密度函数为

基于条件概率函数的定义,我们可以自然地定义 条件 累积分布函数如下。

定义。(条件累积分布函数)令 为离散或连续随机变量。 在给定 条件累积分布函数 (cdf),其中 为实数,为

备注。

  • 需要注意的是,当 是连续的,事件 的概率为零。因此,根据条件概率的定义,在这种情况下,条件累积分布函数应该是 未定义 的。然而,在这种情况下,我们仍然将条件概率定义为一个有意义且已定义的表达式。

定义的图形说明(连续随机变量)

Top view:
     
        |
        |
        *---------------* 
        |               |
        |               |
fixed y *=========@=====* <--- corresponding interval
        |         x     |
        |               |
        *---------------*
        |
        *---------------- 

Side view:

          *  
         / \ 
        *\  *  /                                           
       /|#\   \
   |  / |##\ / *---------*
   | *  |###\            /\
   | |\ |##/#\----------/--\     
   | | \|#/###*--------*   /                             
   | |  \/#########   / \ /                              
   | |y *\========@==/===*                               
   | | /  *-------x-*   /                                
   | |/              \ /                                 
   | *----------------*                                  
   |/                                                    
   *------------------------- x                          


Front view:

    |
    |
    |
    *\      
    |#\    
    |##\              
    |###\             
    |####\   <------------- Area: f_Y(y)         
    |#####*--------*  
    |###########    \ 
    *==========@=====*--------------  
               x
*---*
|###| : the desired region from the cross section from joint pdf, whose area is the probability from the cdf
*---*   

如果 对于某个事件 ,为了简化,我们有一些特殊的记号

  • 给定 的条件概率函数变为

  • 给定 的条件累积分布函数变为

命题。 (确定两个随机变量的独立性)随机变量 独立的 当且仅当 对于每个 成立。

证明。 回想一下两个随机变量之间独立性的定义

是独立的,如果

对于每个 .

由于 对于每个 ,我们得到了所需的结果。

备注。

  • 这是意料之中的,因为对独立事件的条件化不应该影响另一个独立事件的发生。


我们可以将条件概率函数和cdf的定义扩展到随机变量组,对于联合cdf和联合概率函数,如下所示

定义。 (条件联合概率函数)令 为两个随机向量。给定 时, 条件 联合概率函数为

然后,我们也有类似的命题来判断两个随机向量的独立性。

命题。 (确定两个随机向量的独立性)随机向量 当且仅当 对于每个

证明。 两个随机向量之间独立性的定义是

  • 是独立的,如果

对于每个

由于对于每个 ,我们有期望的结果。

双变量正态分布的条件分布

[编辑 | 编辑源代码]

回想一下概率/重要分布一章, 的联合概率密度函数为 ,并且在本例中 。其中 为正数。

命题。(二元正态分布的条件分布)设 . 那么,(符号滥用:当我们说“”的分布时,我们的意思是条件分布在给定下的分布)。

证明。

  • 首先,条件概率密度函数

  • 然后,我们可以看到 ,
  • 并且,通过对称性(互换,以及互换),.

概念的条件版本

[编辑 | 编辑源代码]

我们可以通过将先前为“无条件”分布建立的概念的条件版本类推地应用于条件分布,方法是将“无条件”的累积分布函数 (cdf)、概率密度函数 (pdf) 或概率质量函数 (pmf)(即 )替换为它们的条件对应部分,即

条件独立性

[编辑 | 编辑源代码]

定义. 随机变量 在给定 的情况下,条件 独立,当且仅当 或者 。对于每个实数 以及每个正整数 ,其中 分别表示 在给定 的条件下的联合累积分布函数和概率函数。

备注。

  • 对于随机变量,条件独立和独立之间没有关系,也就是说其中一个意味着另一个。

示例. (条件独立不意味着独立)TODO

示例. (独立不意味着条件独立)TODO

条件期望

[编辑 | 编辑源代码]

定义。 (条件期望)设 在给定 时的条件概率函数。则,

备注。

  • 的函数。
  • 这个 随机变量 ,在计算期望后成为了 的函数,简写为 ,其中 代表相同项。
  • 实现 被观察到为 ,其中 指的是相同的项。

类似地,我们有无意识统计学家定律的条件版本。

命题。 (无意识统计学家定律 (条件版本)) 令 在给定 下的条件概率函数。那么,对于每个函数

命题。 (独立性下的条件期望) 如果随机变量 是独立的, 对于每个函数

证明:

备注。

  • 如果 不独立,则该等式可能成立。

示例: 假设随机向量 其中 是独立的随机变量,且 。那么, ( 被视为常数,因为它是条件化的:在实现 后它就变成了常数)但

的性质仍然适用于条件期望,其中所有“无条件”期望都被替换为“条件”期望,并进行了一些适当的修改,如下所示

命题. (条件期望的性质)对于每个随机变量 ,

  • (线性)
对于每个函数 的函数, 以及每个随机变量
  • (非负性) 如果 , 那么
  • (单调性) 如果 , 那么 对于每个随机变量
  • (三角不等式)

  • (在独立性下的乘法性) 如果 在给定 时条件独立,

证明。 证明与“无条件”期望的证明类似。

备注。

  • 在给定 时被视为常数 给定,因为在观察到 的值后,它们不能被改变。
  • 每个结果在用随机向量 替换 时仍然成立。

关于条件期望的以下定理非常重要。

定理。 (全期望定律) 对于每个函数 和每个随机变量

证明。

备注。

  • 我们可以用 代替 ,得到

推论. (全概率公式的推广)对于每一个事件

证明。

  • 首先,

  • 然后,根据全期望公式,

备注。

  • 期望是针对 计算的,所以我们使用 符号。如果需要,我们会使用类似的符号来表示期望计算所针对的随机变量。
  • 我们可以用 替换 ,它是一个随机向量。
  • 如果 离散的,则结果的展开形式是 (全概率公式的离散情况)。
  • 如果 连续 的,那么结果的展开形式为 (全概率公式的连续情况)。

推论。(全概率公式的期望版本)假设样本空间 ,其中 互斥 的。那么,

证明。 定义 如果 发生,其中 是一个正整数。那么,

备注。

  • 事件的数量可以是有限的,只要它们是互斥的,并且它们的并集是整个样本空间
  • 如果 ,它简化为 全概率公式

示例。 是人类身高(单位:米)。从一个由 相同数量 的男性和女性组成的群体中随机选择一个人。假设男性的平均身高是 1.8 米,女性的平均身高是 1.7 米,那么整个人口的平均身高是

推论。 (条件期望公式) 对于每个随机变量 和事件 ,其中

证明。 根据条件期望加权平均计算期望的公式,,如果 ,则结果成立。

备注。

  • 如果 ,它将简化为条件概率 定义,这是概率和期望之间的基本桥梁。

定义了 条件 期望后,我们也可以有 条件 方差、协方差和相关系数,因为方差、协方差和相关系数都是基于期望构建的。

双变量正态分布的条件期望

[edit | edit source]

命题。 (双变量正态分布的条件期望)令 . 那么,

证明。

  • 该结果直接从关于双变量正态分布的条件分布的命题得出。


条件方差

[编辑 | 编辑源代码]

定义。 (条件方差)随机变量 在给定 的条件下的 条件 方差是

类似地,我们有 条件 方差的性质,它们与方差的性质类似。

命题。 (条件方差的性质)对于每个随机变量

  • (条件方差的替代公式)
  • (在位置参数变化下不变)
  • (二阶齐次性)
  • (非负性)
  • (零方差意味着非随机性) 对于某个 函数的
  • (独立性下的可加性) 如果 在给定 条件下是独立的,

证明. 证明类似于方差性质的证明。

除了全期望公式,我们还有全方差公式,如下

命题. (全方差公式) 对于每个随机变量

证明。

备注。

  • 我们可以用 ,一个随机向量,来替换

二元正态分布的条件方差

[编辑 | 编辑来源]

命题。 (二元正态分布的条件方差)令 。那么,

证明。

  • 这个结果可以直接从关于二元正态分布条件分布的命题中得出。

备注。

  • 可以观察到,条件中的 的精确值并不重要。对于不同的值,结果是相同的。


条件协方差

[编辑 | 编辑源代码]

定义。(条件协方差) 在给定 条件 协方差为

命题。(条件协方差的性质)

(i) (symmetry) for each random variable , (ii) for each random variable , (iii) (alternative formula of covariance) (iv) for each constant , and for each random variables , (v) for each random variable ,


条件相关系数

[编辑 | 编辑源代码]

定义。(条件相关系数)随机变量 在给定 条件 相关系数为

备注。

  • 类似于“无条件”相关系数,条件 相关系数也介于 之间(包含边界值)。证明方法类似,只是将所有无条件项替换为条件项。


条件分位数

[编辑 | 编辑源代码]

定义。 (条件分位数) 给定 条件 分位数是 的:

备注。

  • 然后,我们可以得到 条件 中位数、四分位距等,它们以与无条件分位数相同的方式使用 条件 分位数来定义。


华夏公益教科书