假设我们给定一个离散随机变量 X {\displaystyle X} 的 pmf 和一个离散随机变量 Y {\displaystyle Y} 的 pmf。例如, f X ( x ) = ( 1 { x = 0 } + 1 { x = 1 } ) / 2 and f Y ( y ) = ( 1 { y = 0 } + 1 { y = 2 } ) / 2 {\displaystyle f_{X}(x)=(\mathbf {1} \{x=0\}+\mathbf {1} \{x=1\})/2\quad {\text{and}}\quad f_{Y}(y)=(\mathbf {1} \{y=0\}+\mathbf {1} \{y=2\})/2} 仅凭这些信息,我们无法判断 X {\displaystyle X} 和 Y {\displaystyle Y} 之间的关系。它们可能相关或不相关。
例如,随机变量 X {\displaystyle X} 可以定义为 X = 1 {\displaystyle X=1} 如果抛出一个公平硬币出现正面,否则为 X = 0 {\displaystyle X=0} ,而随机变量 Y {\displaystyle Y} 可以定义为 Y = 2 {\displaystyle Y=2} 如果再次抛硬币出现正面,否则为 Y = 0 {\displaystyle Y=0} 。在这种情况下, X {\displaystyle X} 和 Y {\displaystyle Y} 是不相关的。
另一种可能性是随机变量 Y {\displaystyle Y} 被定义为 Y = 2 X {\displaystyle Y=2X} 如果第一次抛硬币出现正面,否则为 Y = 0 {\displaystyle Y=0} 。在这种情况下, X {\displaystyle X} 和 Y {\displaystyle Y} 是相关的。
然而,在以上两个例子中, X {\displaystyle X} 和 Y {\displaystyle Y} 的概率质量函数完全相同。
因此,为了说明 关系 在 X {\displaystyle X} 和 Y {\displaystyle Y} 之间,我们定义了 联合 累积分布函数,或者叫做联合CDF。
定义。 (联合累积分布函数) 设 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 是定义在样本空间 Ω {\displaystyle \Omega } 上的随机变量。随机变量 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 的 联合 累积分布函数 (CDF) 为 F ( x 1 , … , x n ) = P ( X 1 ≤ x 1 ∩ ⋯ ∩ X n ≤ x n ) = P ( ⋂ i = 1 n { ω ∈ Ω : X i ( ω ) ≤ x i } ) . {\displaystyle F(x_{1},\dotsc ,x_{n})=\mathbb {P} (X_{1}\leq x_{1}\cap \cdots \cap X_{n}\leq x_{n})=\mathbb {P} \left(\bigcap _{i=1}^{n}\{\omega \in \Omega :X_{i}(\omega )\leq x_{i}\}\right).}
有时,我们可能想知道一个联合CDF中涉及的随机变量的随机行为。我们可以通过从联合CDF计算边际CDF来实现这一点。边际CDF的定义如下
备注。 实际上, X i {\displaystyle X_{i}} 的边际CDF 仅仅是 X i {\displaystyle X_{i}} 的CDF(它是单个变量的)。我们已经在前面的章节中讨论了这种CDF。
命题。 (从联合累积分布函数 (CDF) 获得边缘 CDF)给定一个联合 CDF F ( x 1 , … , x n ) {\displaystyle F(x_{1},\dotsc ,x_{n})} , X i {\displaystyle X_{i}} 的边缘 CDF 是 F X i ( x ) = F ( ∞ , … , ∞ , x ⏟ i -th position , ∞ , … , ∞ ) . {\displaystyle F_{X_{i}}(x)=F(\infty ,\dotsc ,\infty ,\underbrace {x} _{i{\text{-th position}}},\infty ,\dotsc ,\infty ).}
备注。 一般来说,我们无法从给定的一组边缘 CDF 推导出联合 CDF。
类似于单变量情况,我们有联合 PMF 和联合 PDF。同样地,我们也有边缘 PMF 和边缘 PDF。
定义。 (联合概率质量函数) X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 的 联合概率质量函数 (联合 PMF)为 f ( x 1 , … , x n ) = P ( ( X 1 , … , X n ) = ( x 1 , … , x n ) ) , ( x 1 , … , x n ) ∈ R n . {\displaystyle f(x_{1},\dotsc ,x_{n})=\mathbb {P} {\big (}(X_{1},\dotsc ,X_{n})=(x_{1},\dotsc ,x_{n}){\big )},\quad (x_{1},\dotsc ,x_{n})\in \mathbb {R} ^{n}.}
命题. (从联合概率质量函数获取边缘概率质量函数) 对于离散随机变量 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} ,其联合概率质量函数为 f {\displaystyle f} ,则 X i {\displaystyle X_{i}} 的边缘概率质量函数为 f X i ( x ) = ∑ u 1 ⋯ ∑ u i − 1 ∑ u i + 1 ⋯ ∑ u n ⏟ n − 1 summations f ( u 1 , … , u i − 1 , x , u i + 1 , … , u n ) . {\displaystyle f_{X_{i}}({\color {red}x})=\underbrace {\sum _{u_{1}}\cdots \sum _{u_{i-1}}\sum _{u_{i+1}}\cdots \sum _{u_{n}}} _{n-1\;{\text{summations}}}f(u_{1},\dotsc ,u_{i-1},{\color {red}x},u_{i+1},\dotsc ,u_{n}).}
证明。 考虑只有两个随机变量的情况,比如 X {\displaystyle X} 和 Y {\displaystyle Y} 。那么,我们有 ∑ y f ( x , y ) = ∑ y P ( X = x ∩ Y = y ) = P ( X = x ) by law of total probability . {\displaystyle \sum _{\color {green}y}f({\color {red}x},{\color {green}y})=\sum _{\color {green}y}\mathbb {P} (X={\color {red}x}\cap {\color {green}Y=y})=\mathbb {P} (X={\color {red}x})\qquad {\text{by law of total probability}}.} 同样地,在一般情况下,我们有 ∑ u n f ( u 1 , … , u i − 1 , x , u i + 1 , … , u n ) = ∑ u n P ( X 1 ≤ u 1 ∩ ⋯ ∩ X i − 1 u i − 1 ∩ X i ≤ x ∩ X i + 1 ≤ u i + 1 ∩ ⋯ ∩ X n − 1 ≤ u n − 1 ∩ X n ≤ u n ) = P ( X 1 ≤ u 1 ∩ ⋯ ∩ X i − 1 u i − 1 ∩ X i ≤ x ∩ X i + 1 ≤ u i + 1 ∩ ⋯ ∩ X n − 1 ≤ u n − 1 ) by law of total probability . {\displaystyle {\begin{aligned}\sum _{\color {green}u_{n}}f(u_{1},\dotsc ,u_{i-1},{\color {red}x},u_{i+1},\dotsc ,{\color {green}u_{n}})&=\sum _{\color {green}u_{n}}\mathbb {P} (X_{1}\leq u_{1}\cap \cdots \cap X_{i-1}u_{i-1}\cap X_{i}\leq {\color {red}x}\cap X_{i+1}\leq u_{i+1}\cap \cdots \cap X_{n-1}\leq u_{n-1}\cap {\color {green}X_{n}\leq u_{n}})\\&=\mathbb {P} (X_{1}\leq u_{1}\cap \cdots \cap X_{i-1}u_{i-1}\cap X_{i}\leq {\color {red}x}\cap X_{i+1}\leq u_{i+1}\cap \cdots \cap X_{n-1}\leq u_{n-1})\qquad {\text{by law of total probability}}.\end{aligned}}} 然后,我们对其他每个变量 ( n − 2 {\displaystyle n-2} 个) 执行类似的过程,每次过程都会增加一个求和符号。因此,总共我们将有 n − 1 {\displaystyle n-1} 个求和符号,最终我们将得到想要的结果。 ◻ {\displaystyle \Box }
备注。 这个过程有时被称为“对其他变量的所有可能值求和”。
示例: 假设我们掷一个公平的六面骰子两次。设 X {\displaystyle X} 表示第一次掷骰子向上的一面,设 Y {\displaystyle Y} 表示第二次掷骰子向上的一面。则 ( X , Y ) {\displaystyle (X,Y)} 的 联合概率质量函数 为 f ( x , y ) = P ( X = x ∩ Y = y ) = 1 6 ⋅ 1 6 = 1 36 . {\displaystyle f(x,y)=\mathbb {P} (X=x\cap Y=y)={\frac {1}{6}}\cdot {\frac {1}{6}}={\frac {1}{36}}.} 其中 x , y ∈ { 1 , 2 , 3 , 4 , 5 , 6 } {\displaystyle x,y\in \{1,2,3,4,5,6\}} ,并且 f ( x , y ) = 0 {\displaystyle f(x,y)=0} 在其他情况下。同时, X {\displaystyle X} 的 边缘概率质量函数 为 f X ( x ) = ∑ y f ( x , y ) = f ( x , 1 ) + f ( x , 2 ) + ⋯ + f ( x , 6 ) = 6 ( 1 / 36 ) = 1 6 {\displaystyle f_{X}(x)=\sum _{y}f(x,y)=f(x,1)+f(x,2)+\cdots +f(x,6)=6(1/36)={\frac {1}{6}}} 其中 x ∈ { 1 , 2 , 3 , 4 , 5 , 6 } {\displaystyle x\in \{1,2,3,4,5,6\}} ,并且 f X ( x ) = 0 {\displaystyle f_{X}(x)=0} 在其他情况下。
通过对称性(将所有 X {\displaystyle X} 替换为 Y {\displaystyle Y} 并且将所有 x {\displaystyle x} 替换为 y {\displaystyle y} ), Y {\displaystyle Y} 的 边缘概率质量函数 为 f Y ( y ) = 1 6 {\displaystyle f_{Y}(y)={\frac {1}{6}}} 其中 y ∈ { 1 , 2 , 3 , 4 , 5 , 6 } {\displaystyle y\in \{1,2,3,4,5,6\}} ,并且 f Y ( x ) = 0 {\displaystyle f_{Y}(x)=0} 在其他情况下。
练习。 回顾动机部分的例子。
(a) 假设我们掷一枚公平的硬币两次。设 X = 1 { 正面朝上 } {\displaystyle X=\mathbf {1} \{{\text{正面朝上}}\}} 和 Y = 2 ⋅ 1 { 正面朝上 } {\displaystyle Y=2\cdot \mathbf {1} \{{\text{正面朝上}}\}} 。证明 ( X , Y ) {\displaystyle (X,Y)} 的联合概率质量函数为 f ( x , y ) = 1 { x ∈ { 0 , 1 } ∩ y ∈ { 0 , 2 } } 4 . {\displaystyle f(x,y)={\frac {\mathbf {1} \{x\in \{0,1\}\cap y\in \{0,2\}\}}{4}}.}
(b) 假设我们掷一枚公平的硬币一次。设 X = 1 { 正面朝上 } {\displaystyle X=\mathbf {1} \{{\text{正面朝上}}\}} 和 Y = 2 X {\displaystyle Y=2X} 。证明 ( X , Y ) {\displaystyle (X,Y)} 的联合概率质量函数为 f ( x , y ) = 1 { x ∈ { 0 , 1 } ∩ y = 2 x } 2 . {\displaystyle f(x,y)={\frac {\mathbf {1} \{x\in \{0,1\}\cap y=2x\}}{2}}.}
(c) 证明 X {\displaystyle X} 和 Y {\displaystyle Y} 的边缘概率质量函数分别为 f X ( x ) = 1 { x ∈ { 0 , 1 } } 2 and f Y ( y ) = 1 { y ∈ { 0 , 2 } } 2 {\displaystyle f_{X}(x)={\frac {\mathbf {1} \{x\in \{0,1\}\}}{2}}\quad {\text{and}}\quad f_{Y}(y)={\frac {\mathbf {1} \{y\in \{0,2\}\}}{2}}} 在 (a) 和 (b) 两种情况下。 (提示:对于 (b) 部分,我们需要在指示器中代入变量的值)
证明。
(a) 由于 ( X , Y ) {\displaystyle (X,Y)} 的支撑集为 { ( 0 , 0 ) , ( 0 , 2 ) , ( 1 , 0 ) , ( 1 , 2 ) } {\displaystyle \{(0,0),(0,2),(1,0),(1,2)\}} , ( X , Y ) {\displaystyle (X,Y)} 的联合概率质量函数为 f ( x , y ) = P ( X = 0 ∩ Y = 0 ) + P ( X = 0 ∩ Y = 2 ) + P ( X = 1 ∩ Y = 0 ) + P ( X = 1 ∩ Y = 2 ) = 1 { x ∈ { 0 , 1 } ∩ y ∈ { 0 , 2 } } 4 . {\displaystyle f(x,y)=\mathbb {P} (X=0\cap Y=0)+\mathbb {P} (X=0\cap Y=2)+\mathbb {P} (X=1\cap Y=0)+\mathbb {P} (X=1\cap Y=2)={\frac {\mathbf {1} \{x\in \{0,1\}\cap y\in \{0,2\}\}}{4}}.}
(b) 由于 ( X , Y ) {\displaystyle (X,Y)} 的支撑集为 x ∈ { 0 , 1 } ∩ y = 2 x {\displaystyle x\in \{0,1\}\cap y=2x} , ( X , Y ) {\displaystyle (X,Y)} 的联合概率质量函数为 f ( x , y ) = P ( X = 0 ∩ Y = 2 ( 0 ) = 0 ) + P ( X = 1 ∩ Y = 2 ( 1 ) = 2 ) = 1 { x ∈ { 0 , 1 } ∩ y = 2 x } 2 . {\displaystyle f(x,y)=\mathbb {P} (X=0\cap Y=2(0)=0)+\mathbb {P} (X=1\cap Y=2(1)=2)={\frac {\mathbf {1} \{x\in \{0,1\}\cap y=2x\}}{2}}.}
(c) (a) 部分: X {\displaystyle X} 的边缘概率质量函数为 f X ( x ) = f ( x , 0 ) + f ( x , 2 ) = 2 1 { x ∈ { 0 , 1 } } 4 = 1 { x ∈ { 0 , 1 } } 2 , {\displaystyle f_{X}(x)=f(x,0)+f(x,2)={\frac {2\mathbf {1} \{x\in \{0,1\}\}}{4}}={\frac {\mathbf {1} \{x\in \{0,1\}\}}{2}},} , Y {\displaystyle Y} 的边缘概率质量函数为 f Y ( y ) = f ( 0 , y ) + f ( 1 , y ) = 2 1 { y ∈ { 0 , 2 } } 4 = 1 { y ∈ { 0 , 2 } } 2 . {\displaystyle f_{Y}(y)=f(0,y)+f(1,y)={\frac {2\mathbf {1} \{y\in \{0,2\}\}}{4}}={\frac {\mathbf {1} \{y\in \{0,2\}\}}{2}}.}
部分 (b): X {\displaystyle X} 的边际 pmf 为 f X ( x ) = f ( x , 0 ) + f ( x , 2 ) = 1 { x ∈ { 0 , 1 } ∩ 0 = 2 x ⏞ x = 0 } 2 + 1 { x ∈ { 0 , 1 } ∩ 2 = 2 x ⏞ x = 1 } 2 = 1 { x = 0 } + 1 { x = 1 } ⏞ 1 { x = 0 ∪ x = 1 } 2 = 1 { x ∈ { 0 , 1 } } 2 . {\displaystyle f_{X}(x)=f(x,0)+f(x,2)={\frac {\mathbf {1} \{\overbrace {x\in \{0,1\}\cap 0=2x} ^{x=0}\}}{2}}+{\frac {\mathbf {1} \{\overbrace {x\in \{0,1\}\cap 2=2x} ^{x=1}\}}{2}}={\frac {\overbrace {\mathbf {1} \{x=0\}+\mathbf {1} \{x=1\}} ^{\mathbf {1} \{x=0\cup x=1\}}}{2}}={\frac {\mathbf {1} \{x\in \{0,1\}\}}{2}}.} 同样, Y {\displaystyle Y} 的边际 pmf 为 f Y ( y ) = f ( 0 , y ) + f ( 1 , y ) = 1 { 0 ∈ { 0 , 1 } ∩ y = 0 } 2 + 1 { 1 ∈ { 0 , 1 } ∩ y = 2 } 2 = 1 { 0 ∈ { 0 , 1 } } ⏞ 1 1 { y = 0 } + 1 { 1 ∈ { 0 , 1 } } ⏞ 1 1 { y = 2 } 2 = 1 { y ∈ { 0 , 2 } } 2 . {\displaystyle f_{Y}(y)=f(0,y)+f(1,y)={\frac {\mathbf {1} \{0\in \{0,1\}\cap y=0\}}{2}}+{\frac {\mathbf {1} \{1\in \{0,1\}\cap y=2\}}{2}}={\frac {\overbrace {\mathbf {1} \{0\in \{0,1\}\}} ^{1}\mathbf {1} \{y=0\}+\overbrace {\mathbf {1} \{1\in \{0,1\}\}} ^{1}\mathbf {1} \{y=2\}}{2}}={\frac {\mathbf {1} \{y\in \{0,2\}\}}{2}}.}
对于 联合 连续随机变量,定义是连续随机变量定义(单变量情况)的推广版本。
定义。 (联合连续随机变量)随机变量 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 是 联合连续 的,如果 P ( ( X 1 , … , X n ) ∈ S ) = ∫ ⋯ ∫ S f ( x 1 , … , x n ) d x 1 ⋯ d x n , S ⊆ R n , {\displaystyle \mathbb {P} {\big (}(X_{1},\dotsc ,X_{n})\in S{\big )}=\int \dotsi \int _{S}f(x_{1},\dotsc ,x_{n})\,dx_{1}\cdots \,dx_{n},\quad S\subseteq \mathbb {R} ^{n},} 对于某个非负函数 f {\displaystyle f} 成立。
备注。
函数 f {\displaystyle f} 是 联合概率密度函数 (joint pdf ) 的 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 。
类似地, f ( x 1 , … , x n ) d x 1 ⋯ d x n {\displaystyle f(x_{1},\dotsc ,x_{n})\,dx_{1}\cdots \,dx_{n}} 可以被理解为在“无穷小”区域 [ x 1 , x 1 + d x 1 ] × ⋯ × [ x n , x n + d x n ] {\displaystyle [x_{1},x_{1}+dx_{1}]\times \dotsb \times [x_{n},x_{n}+dx_{n}]} 上的概率,而 f ( x 1 , … , x n ) {\displaystyle f(x_{1},\dotsc ,x_{n})} 可以被理解为该“无穷小”区域上概率的密度,即 P ( X ∈ [ x 1 , x 1 + d x 1 ] × ⋯ × [ x n , x n + d x n ] ) d x 1 ⋯ d x n {\displaystyle {\frac {\mathbb {P} {\big (}X\in [x_{1},x_{1}+dx_{1}]\times \dotsb \times [x_{n},x_{n}+dx_{n}]{\big )}}{dx_{1}\dotsb dx_{n}}}} ,直观且非严格地。
通过设定 S = ( − ∞ , x 1 ] × ⋯ × ( − ∞ , x n ] {\displaystyle S=(-\infty ,x_{1}]\times \dotsb \times (-\infty ,x_{n}]} ,累积分布函数为
F ( x 1 , … , x n ) = ∫ − ∞ x 1 ⋯ ∫ − ∞ x n ⏟ n integrations f ( u 1 , … , u n ) d u n ⋯ d u 1 , {\displaystyle F(x_{1},\dotsc ,x_{n})=\underbrace {\int _{-\infty }^{x_{1}}\cdots \int _{-\infty }^{x_{n}}} _{n\;{\text{integrations}}}f(u_{1},\dotsc ,u_{n})\,du_{n}\cdots \,du_{1},}
这与一元的情况类似。
命题。 (从联合 pdf 获得边缘 pdf) 对于连续随机变量 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} ,其联合 pdf 为 f {\displaystyle f} , X i {\displaystyle X_{i}} 的边缘 pdf 为 f X i ( x ) = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ ⏟ n − 1 integrations f ( u 1 , … , u i − 1 , x , u i + 1 , … , u n ) d u 1 ⋯ d u i − 1 d u i + 1 ⋯ d u n . {\displaystyle f_{X_{i}}({\color {red}x})=\underbrace {\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }} _{n-1\;{\text{integrations}}}f(u_{1},\dotsc ,u_{i-1},{\color {red}x},u_{i+1},\dotsc ,u_{n})\,du_{1}\cdots \,du_{i-1}\,du_{i+1}\cdots \,du_{n}.}
证明。 回忆关于从联合累积分布函数得到边缘累积分布函数的命题。我们有 F X i ( x ) = F ( ∞ , … , ∞ , x ⏞ i -th position , ∞ , … , ∞ ) ⇒ ∫ − ∞ x f X i ( u ) d u = ∫ − ∞ ∞ ⋯ ∫ − ∞ x ⋯ ∫ − ∞ ∞ f ( u 1 , … , u n ) d u n ⋯ d u i ⋯ d u 1 by definitions ⇒ d d x ∫ − ∞ x f X i ( u ) d u = d d x ∫ − ∞ ∞ ⋯ ∫ − ∞ x ⋯ ∫ − ∞ ∞ f ( u 1 , … , u n ) d u n ⋯ d u i ⋯ d u 1 ⇒ f X i ( x ) = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ ⏟ n − 1 integrations f ( u 1 , … , u i − 1 , x , u i + 1 , … , u n ) d u 1 ⋯ d u i − 1 d u i + 1 ⋯ d u n by fundamental theorem of calculus {\displaystyle {\begin{aligned}&&F_{X_{i}}({\color {red}x})&=F(\infty ,\dotsc ,\infty ,\overbrace {\color {red}x} ^{i{\text{-th position}}},\infty ,\dotsc ,\infty )\\&\Rightarrow &\int _{-\infty }^{\color {red}x}f_{X_{i}}(u)\,du&=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\color {red}x}\cdots \int _{-\infty }^{\infty }f(u_{1},\dotsc ,u_{n})\,du_{n}\cdots \,du_{i}\cdots \,du_{1}\qquad {\text{by definitions}}\\&\Rightarrow &{\frac {d}{dx}}\int _{-\infty }^{\color {red}x}f_{X_{i}}(u)\,du&={\frac {d}{dx}}\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\color {red}x}\cdots \int _{-\infty }^{\infty }f(u_{1},\dotsc ,u_{n})\,du_{n}\cdots \,du_{i}\cdots \,du_{1}\\&\Rightarrow &f_{X_{i}}({\color {red}x})&=\underbrace {\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }} _{n-1\;{\text{integrations}}}f(u_{1},\dotsc ,u_{i-1},{\color {red}x},u_{i+1},\dotsc ,u_{n})\,du_{1}\cdots \,du_{i-1}\,du_{i+1}\cdots \,du_{n}\qquad {\text{by fundamental theorem of calculus}}\end{aligned}}}
◻ {\displaystyle \Box }
命题。 (从联合累积分布函数得到联合概率密度函数) 如果联合累积分布函数 F {\displaystyle F} 的联合连续随机变量在 ( x 1 , … , x n ) {\displaystyle (x_{1},\dotsc ,x_{n})} 处具有每个 偏导数 ,则联合概率密度函数为 f ( x 1 , … , x n ) = ∂ n ∂ x 1 ⋯ ∂ x n F ( x 1 , ⋯ , x n ) . {\displaystyle f(x_{1},\dotsc ,x_{n})={\frac {\partial ^{n}}{\partial x_{1}\cdots \partial x_{n}}}F(x_{1},\cdots ,x_{n}).}
证明。 它来自于使用微积分基本定理 n {\displaystyle n} 次。
◻ {\displaystyle \Box }
示例。 如果联合连续随机变量 ( X , Y ) {\displaystyle (X,Y)} 的联合概率密度函数为 f ( x , y ) = 1 4 x y ( 1 { x , y ∈ [ 0 , 1 ] } ) , {\displaystyle f(x,y)={\frac {1}{4}}xy(\mathbf {1} \{x,y\in [0,1]\}),} 那么 X {\displaystyle X} 的边缘概率密度函数为 f X ( x ) = ∫ − ∞ ∞ 1 4 x y ( 1 { x ∈ [ 0 , 1 ] } 1 { y ∈ [ 0 , 1 ] } ) d y = 1 4 x ( 1 { x ∈ [ 0 , 1 ] } ) ∫ 0 1 y d y ⏟ 1 2 / 2 − 0 2 / 2 = 1 8 x ( 1 { x ∈ [ 0 , 1 ] } ) . {\displaystyle f_{X}(x)=\int _{-\infty }^{\infty }{\frac {1}{4}}xy(\mathbf {1} \{x\in [0,1]\}\mathbf {1} \{y\in [0,1]\})\,dy={\frac {1}{4}}x(\mathbf {1} \{x\in [0,1]\})\underbrace {\int _{0}^{1}y\,dy} _{1^{2}/2-0^{2}/2}={\frac {1}{8}}x(\mathbf {1} \{x\in [0,1]\}).} 此外, P ( ( X , Y ) ≤ ( 1 / 2 , 1 / 2 ) ) = ∫ − ∞ 1 / 2 ∫ − ∞ 1 / 2 1 4 x y ( 1 { x , y ∈ [ 0 , 1 ] } d x d y = 1 4 ∫ 0 1 / 2 y ∫ 0 1 / 2 x d x d y = 1 4 ⋅ ( 1 / 2 ) 2 2 ∫ 0 1 / 2 y d y = 1 4 ⋅ 1 8 ⋅ 1 8 = 1 256 . {\displaystyle \mathbb {P} ((X,Y)\leq (1/2,1/2))=\int _{-\infty }^{1/2}\int _{-\infty }^{1/2}{\frac {1}{4}}xy(\mathbf {1} \{x,y\in [0,1]\}\,dx\,dy={\frac {1}{4}}\int _{0}^{1/2}y\int _{0}^{1/2}x\,dx\,dy={\frac {1}{4}}\cdot {\frac {(1/2)^{2}}{2}}\int _{0}^{1/2}y\,dy={\frac {1}{4}}\cdot {\frac {1}{8}}\cdot {\frac {1}{8}}={\frac {1}{256}}.}
回想一下,如果多个事件的交集的概率等于每个事件的概率的乘积,那么根据定义,这些事件是独立的。由于 { X ∈ A } {\displaystyle \{X\in A\}} 也是一个事件,因此我们对 随机变量 的独立性有以下自然定义
定义。 (随机变量的独立性)随机变量 X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\dotsc ,X_{n}} 是 独立 的,如果 P ( X 1 ∈ A 1 ∩ ⋯ ∩ X n ∈ A n ) = P ( X 1 ∈ A 1 ) ⋯ P ( X n ∈ A n ) {\displaystyle \mathbb {P} (X_{1}\in A_{1}\cap \cdots \cap X_{n}\in A_{n})=\mathbb {P} (X_{1}\in A_{1})\cdots \mathbb {P} (X_{n}\in A_{n})} 对于每个 n {\displaystyle n} 和每个子集 A 1 , A 2 , … , A n ⊆ R {\displaystyle A_{1},A_{2},\dotsc ,A_{n}\subseteq \mathbb {R} } 。
备注。 在这种情况下,事件 { X 1 ∈ A 1 } , … , { X n ∈ A n } {\displaystyle \{X_{1}\in A_{1}\},\dotsc ,\{X_{n}\in A_{n}\}} 是独立的。
定理。 (随机变量独立性的另一种条件)随机变量 X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\dotsc ,X_{n}} 是 独立 当且仅当 ( X 1 , … , X n ) {\displaystyle (X_{1},\dotsc ,X_{n})} 的联合 cdf F ( x 1 , … , x n ) = F X 1 ( x 1 ) ⋯ F X n ( x n ) {\displaystyle F(x_{1},\dotsc ,x_{n})=F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n})} 或者 ( X 1 , … , X n ) {\displaystyle (X_{1},\dotsc ,X_{n})} 的联合 pdf 或 pmf f ( x 1 , … , x n ) = f X 1 ( x 1 ) ⋯ f X n ( x n ) {\displaystyle f(x_{1},\dotsc ,x_{n})=f_{X_{1}}(x_{1})\cdots f_{X_{n}}(x_{n})} 对于每个 x 1 , … , x n ∈ R {\displaystyle x_{1},\dotsc ,x_{n}\in \mathbb {R} } 。
证明。 部分
仅当部分:如果随机变量 X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\dotsc ,X_{n}} 是独立的, P ( X 1 ∈ A 1 ∩ ⋯ ∩ X n ∈ A n ) = P ( X 1 ∈ A 1 ) ⋯ P ( X n ∈ A n ) {\displaystyle \mathbb {P} (X_{1}\in A_{1}\cap \cdots \cap X_{n}\in A_{n})=\mathbb {P} (X_{1}\in A_{1})\cdots \mathbb {P} (X_{n}\in A_{n})} 对于每个 n {\displaystyle n} 以及对于每个子集 A 1 , A 2 , … , A n ⊆ R {\displaystyle A_{1},A_{2},\dotsc ,A_{n}\subseteq \mathbb {R} } 。设置 A 1 = ( − ∞ , x 1 ) , … , A n = ( − ∞ , x n ) {\displaystyle A_{1}=(-\infty ,x_{1}),\dotsc ,A_{n}=(-\infty ,x_{n})} ,我们有 P ( X 1 ≤ x 1 ∩ ⋯ ∩ X n ≤ x n ) = P ( X 1 ≤ x 1 ) ⋯ P ( X n ≤ x n ) ⟹ F ( x 1 , … , x n ) = F X 1 ( x 1 ) ⋯ F X n ( x n ) . {\displaystyle \mathbb {P} (X_{1}\leq x_{1}\cap \cdots \cap X_{n}\leq x_{n})=\mathbb {P} (X_{1}\leq x_{1})\cdots \mathbb {P} (X_{n}\leq x_{n})\implies F(x_{1},\dotsc ,x_{n})=F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n}).} 因此,我们得到了联合累积分布函数部分的结果。
对于联合pdf部分, F ( x 1 , … , x n ) = F X 1 ( x 1 ) ⋯ F X n ( x n ) ⇒ ∂ n ∂ x 1 ⋯ ∂ x n F ( x 1 , … , x n ) = ∂ n ∂ x 1 ⋯ ∂ x n ( F X 1 ( x 1 ) ⋯ F X n ( x n ) ) ⇒ f ( x 1 , … , x n ) = f X n ( x n ) ∂ n ∂ x 1 ⋯ ∂ x n − 1 ( F X 1 ( x 1 ) ⋯ F X n − 1 ( x n − 1 ) ) = f X n ( x n ) f X n − 1 ( x n − 1 ) ∂ n ∂ x 1 ⋯ ∂ x n − 2 ( F X 1 ( x 1 ) ⋯ F X n − 2 ( x n − 2 ) ) = ⋯ = f X 1 ( x 1 ) ⋯ f X n ( x n ) {\displaystyle {\begin{aligned}&&F(x_{1},\dotsc ,x_{n})&=F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n})\\&\Rightarrow &{\frac {\partial ^{n}}{\partial x_{1}\cdots \partial x_{n}}}F(x_{1},\dotsc ,x_{n})&={\frac {\partial ^{n}}{\partial x_{1}\cdots \partial x_{n}}}\left(F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n})\right)\\&\Rightarrow &f(x_{1},\dotsc ,x_{n})&=f_{X_{n}}(x_{n}){\frac {\partial ^{n}}{\partial x_{1}\cdots \partial x_{n-1}}}\left(F_{X_{1}}(x_{1})\cdots F_{X_{n-1}}(x_{n-1})\right)\\&&&=f_{X_{n}}(x_{n})f_{X_{n-1}}(x_{n-1}){\frac {\partial ^{n}}{\partial x_{1}\cdots \partial x_{n-2}}}\left(F_{X_{1}}(x_{1})\cdots F_{X_{n-2}}(x_{n-2})\right)\\&&&=\cdots =f_{X_{1}}(x_{1})\cdots f_{X_{n}}(x_{n})\end{aligned}}}
◻ {\displaystyle \Box }
备注。
也就是说,如果联合cdf(联合pdf(pmf))可以分解为边缘cdf(边缘pdf(pmf))的乘积
实际上,如果我们可以将联合cdf或联合pdf或联合pmf分解为每个变量中一些函数的乘积,那么该条件也满足。
示例。 两个独立 指数随机变量,速率为 λ {\displaystyle \lambda } , X {\displaystyle X} 和 Y {\displaystyle Y} 的联合pdf是 f ( x , y ) = ( 1 { x ≥ 0 } λ e − λ x ) ( 1 { y ≥ 0 } λ e − λ y ) = 1 { x , y ≥ 0 } λ 2 e − λ ( x + y ) . {\displaystyle f(x,y)=(\mathbf {1} \{x\geq 0\}\lambda e^{-\lambda x})(\mathbf {1} \{y\geq 0\}\lambda e^{-\lambda y})=\mathbf {1} \{x,y\geq 0\}\lambda ^{2}e^{-\lambda (x+y)}.} (在这种情况下,随机变量 X {\displaystyle X} 和 Y {\displaystyle Y} 被称为独立同分布 (i.i.d.)
一般来说, n {\displaystyle n} 个速率为 λ {\displaystyle \lambda } 的独立 指数随机变量的联合概率密度函数为 f ( x 1 , … , x n ) = 1 { x 1 , … , x n ≥ 0 } λ n e − λ ( x 1 + ⋯ + x n ) . {\displaystyle f(x_{1},\dotsc ,x_{n})=\mathbf {1} \{x_{1},\dotsc ,x_{n}\geq 0\}\lambda ^{n}e^{-\lambda (x_{1}+\cdots +x_{n})}.} ( X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 在这种情况下也是独立同分布的)。
另一方面,如果两个随机变量 V {\displaystyle V} 和 W {\displaystyle W} 的联合概率密度函数为 f ( v , w ) = 1 { w ≤ 2 − 2 v } , {\displaystyle f(v,w)=\mathbf {1} \{w\leq 2-2v\},} 那么随机变量 V {\displaystyle V} 和 W {\displaystyle W} 是相关的 ,因为联合概率密度函数不能分解为边缘概率密度函数的乘积。
练习。 令 X , Y , Z {\displaystyle X,Y,Z} 为联合连续随机变量。考虑 ( X , Y , Z ) {\displaystyle (X,Y,Z)} 的联合概率密度函数: f ( x , y , z ) = 1 { x , y , z ≥ 0 } 1 { x + y + z / k ≤ 1 } . {\displaystyle f(x,y,z)=\mathbf {1} \{x,y,z\geq 0\}\mathbf {1} \{x+y+z/k\leq 1\}.}
考虑 ( X , Y , Z ) {\displaystyle (X,Y,Z)} 的另一个联合概率密度函数: f ( x , y , z ) = 1 { x , y , z ≥ 0 } 1 { y ≤ 1 − x } 1 { z ≤ k } {\displaystyle f(x,y,z)=\mathbf {1} \{x,y,z\geq 0\}\mathbf {1} \{y\leq 1-x\}\mathbf {1} \{z\leq k\}}
考虑另一个 ( X , Y , Z ) {\displaystyle (X,Y,Z)} 的联合概率密度函数: f ( x , y , z ) = k x y z 1 { x , y ∈ [ 0 , 1 ] } 1 { z ∈ [ 0 , 2 ] } . {\displaystyle f(x,y,z)=kxyz\mathbf {1} \{x,y\in [0,1]\}\mathbf {1} \{z\in [0,2]\}.}
命题. (关于独立随机变量不相交集的事件的独立性)假设随机变量 X 1 , X 2 , … {\displaystyle X_{1},X_{2},\dotsc } 是独立的。那么,对于每个 r < s < t < ⋯ {\displaystyle r<s<t<\cdots } 和固定的函数 f 1 , f 2 , f 3 , … {\displaystyle f_{1},f_{2},f_{3},\dotsc } ,随机变量 Y 1 = f 1 ( X 1 , … , X r ) , Y 2 = f 2 ( X r + 1 , … , X s ) , Y 3 = f 3 ( X s + 1 , … , X t ) , … {\displaystyle Y_{1}=f_{1}(X_{1},\dotsc ,X_{\color {red}r}),\quad Y_{2}=f_{2}(X_{{\color {red}r}+1},\dotsc ,X_{\color {blue}s}),\quad Y_{3}=f_{3}(X_{{\color {blue}s}+1},\dotsc ,X_{t}),\dotsc } 也是独立的。
练习。
一般来说,我们使用联合累积分布函数、概率密度函数或概率质量函数,根据基本原理来确定独立随机变量之和的分布。特别地,关于和 的分布,有一些有趣的结论,这些结论与独立的 随机变量有关。
独立随机变量之和
证明。
cdf: F X + Y ( z ) = P ( X + Y ≤ z ) by definition = ∬ x + y ≤ z f X ( x ) f Y ( y ) d x d y by definition and independence = ∫ − ∞ ∞ ∫ − ∞ z − y f X ( x ) f Y ( y ) d x d y by Fubini's theorem = ∫ − ∞ ∞ ( ∫ − ∞ z − y f X ( x ) d x ) f Y ( y ) d y = ∫ − ∞ ∞ F X ( z − y ) f Y ( y ) d y by definition . {\displaystyle {\begin{aligned}F_{X+Y}(z)&=\mathbb {P} (X+Y\leq z)&{\text{by definition}}\\&=\iint _{x+y\leq z}f_{X}(x)f_{Y}(y)\,dx\,dy&{\text{by definition and independence}}\\&=\int _{-\infty }^{\infty }\int _{-\infty }^{z-y}f_{X}(x)f_{Y}(y)\,dx\,dy&{\text{by Fubini's theorem}}\\&=\int _{-\infty }^{\infty }\left(\int _{-\infty }^{z-y}f_{X}(x)\,dx\right)f_{Y}(y)\,dy\\&=\int _{-\infty }^{\infty }F_{X}(z-y)f_{Y}(y)\,dy&{\text{by definition}}.\end{aligned}}}
/\
//\ y
///\|
////*
////|\
////|/\
////|//\ x+y=z <=> x=z-y
////|///\
////|////\
----*-----*--------------- x
////|//////\
////|///////\
-->: -infty to z-y
^
|: -infty to infty
*--*
|//| : x+y <= z
*--*
pdf: f X + Y ( z ) = d d z ∫ − ∞ ∞ F X ( z − y ) f Y ( y ) d y = ∫ − ∞ ∞ d d z F X ( z − y ) f Y ( y ) d y by fundamental theorem of calculus = ∫ − ∞ ∞ f X ( z − y ) f Y ( y ) d y . {\displaystyle {\begin{aligned}f_{X+Y}(z)&={\frac {d}{dz}}\int _{-\infty }^{\infty }F_{X}(z-y)f_{Y}(y)\,dy\\&=\int _{-\infty }^{\infty }{\frac {d}{dz}}F_{X}(z-y)f_{Y}(y)\,dy&{\text{by fundamental theorem of calculus}}\\&=\int _{-\infty }^{\infty }f_{X}(z-y)f_{Y}(y)\,dy.\end{aligned}}}
◻ {\displaystyle \Box }
例子。
令 X {\displaystyle X} 的概率密度函数为 f ( x ) = 1 { 0 ≤ x ≤ 1 } {\displaystyle f(x)=\mathbf {1} \{0\leq {\color {blue}x}\leq 1\}} .
令 Y {\displaystyle Y} 的概率密度函数为 f ( y ) = 1 { − 1 ≤ y ≤ 0 } {\displaystyle f(y)=\mathbf {1} \{-1\leq y\leq 0\}} .
那么, X + Y {\displaystyle X+Y} 的概率密度函数为
f X + Y ( z ) = ∫ − ∞ ∞ 1 { 0 ≤ z − y ≤ 1 } 1 { − 1 ≤ y ≤ 0 } d y = ∫ − ∞ ∞ 1 { z − 1 ≤ y ≤ z } 1 { − 1 ≤ y ≤ 0 } d y = 1 { 0 ≤ z ≤ 1 } ∫ z − 1 0 d y + 1 { − 1 ≤ z ≤ 0 } ∫ z 0 d y = 1 { 0 ≤ z ≤ 1 } ( 1 − z ) − z 1 { − 1 ≤ z ≤ 0 } . {\displaystyle {\begin{aligned}f_{X+Y}(z)&=\int _{-\infty }^{\infty }\mathbf {1} \{0\leq {\color {blue}z-y}\leq 1\}\mathbf {1} \{-1\leq y\leq 0\}\,dy\\&=\int _{-\infty }^{\infty }\mathbf {1} \{z-1\leq y\leq z\}\mathbf {1} \{-1\leq y\leq 0\}\,dy\\&=\mathbf {1} \{0\leq z\leq 1\}\int _{z-1}^{0}\,dy+\mathbf {1} \{-1\leq z\leq 0\}\int _{z}^{0}\,dy\\&=\mathbf {1} \{0\leq z\leq 1\}(1-z)-z\mathbf {1} \{-1\leq z\leq 0\}.\end{aligned}}} 图形上,概率密度函数看起来像
y
|
|
|
* * 1
\ |\
y=-z \| \ y=1-z
-----*--*--*----- z
-1 O| 1
|
-1 *
|
练习。
例如: 我们连续两次掷一个公平的六面骰子(独立地)。 那么,两次掷出的数字之和为 7 的概率是 ( 1 / 6 ) ( 1 / 6 ) + ⋯ + ( 1 / 6 ) ( 1 / 6 ) ⏟ 6 times = 1 / 6 {\displaystyle \underbrace {(1/6)(1/6)+\dotsb +(1/6)(1/6)} _{6{\text{ times}}}=1/6} .
练习。
示例。 设有两个服务柜台,第一个柜台每小时收到 X ∼ Pois ( 3 ) {\displaystyle X\sim \operatorname {Pois} (3)} 个咨询,而第二个柜台每小时收到 Y ∼ Pois ( 4 ) {\displaystyle Y\sim \operatorname {Pois} (4)} 个咨询。假设 X {\displaystyle X} 和 Y {\displaystyle Y} 独立,则两个柜台每小时收到的咨询数量服从 Pois ( 3 + 4 ) = Pois ( 7 ) {\displaystyle \operatorname {Pois} (3+4)=\operatorname {Pois} (7)} .
证明。
两个柜台每小时收到的咨询数量是 X + Y {\displaystyle X+Y} .
然后,结果来自 Poisson 随机变量之和的命题。
◻ {\displaystyle \Box }
练习。
定义. (顺序统计量) 设 X 1 , … , X n {\displaystyle X_{1},\dotsc ,X_{n}} 是 n {\displaystyle n} 个独立同分布的随机变量 (每个随机变量的累积分布函数为 F ( x ) {\displaystyle F(x)} )。定义 X ( 1 ) , X ( 2 ) , … , X ( n ) {\displaystyle X_{(1)},X_{(2)},\dotsc ,X_{(n)}} 为 X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\dotsc ,X_{n}} 中最小值、第二小值、...、最大值。那么,有序值 X ( 1 ) ≤ X ( 2 ) ≤ ⋯ ≤ X ( n ) {\displaystyle X_{(1)}\leq X_{(2)}\leq \dotsb \leq X_{(n)}} 称为 顺序统计量 。
示例。 令 X 1 , X 2 , X 3 {\displaystyle X_{1},X_{2},X_{3}} 为独立同分布的随机变量,服从 Exp ( 2 ) {\displaystyle \operatorname {Exp} (2)} 。那么, X ( 2 ) {\displaystyle X_{(2)}} 的累积分布函数为 ∑ j = 2 3 ( 3 j ) ( F ( x ) ) j ( 1 − F ( x ) ) 3 − j = 1 { x ≥ 0 } ( ( 3 2 ) ( 1 − e − 2 x ) 2 ( e − 2 x ) + ( 3 3 ) ( 1 − e − 2 x ) 3 ) = 1 { x ≥ 0 } ( 3 ( 1 − e − 2 x ) 2 ( e 2 x ) + ( 1 − e − 2 x ) 3 ) . {\displaystyle \sum _{j=2}^{3}{\binom {3}{j}}(F(x))^{j}(1-F(x))^{3-j}=\mathbf {1} \{x\geq 0\}\left({\binom {3}{2}}(1-e^{-2x})^{2}(e^{-2x})+{\binom {3}{3}}(1-e^{-2x})^{3}\right)=\mathbf {1} \{x\geq 0\}\left(3(1-e^{-2x})^{2}(e^{2x})+(1-e^{-2x})^{3}\right).}
练习。
泊松过程有一些重要的性质。
命题: (固定时间间隔内的到达次数)固定时间间隔内到达事件的次数,其时间长度为 t {\displaystyle t} ,服从 Pois ( λ t ) {\displaystyle \operatorname {Pois} (\lambda t)} 分布。
Proof. For each nonnegative integer n {\displaystyle n} , let V {\displaystyle V} be the interarrival time between the n {\displaystyle n} -th and n + 1 {\displaystyle n+1} -th arrival, and W {\displaystyle W} be the time to n {\displaystyle n} th event, starting from the beginning of the fixed time interval (we can treat the start to be time zero because of the memoryless property). The joint pdf of ( V , W ) {\displaystyle (V,W)} is f ( v , w ) = f V ( v ) f W ( w ) by independence = ( λ e − λ v ) ⏟ pdf of Exp ( λ ) ( λ n w n − 1 e − λ w ( n − 1 ) ! ) ⏟ pdf of Gamma ( n , λ ) . {\displaystyle {\begin{aligned}f(v,w)&=f_{V}(v)f_{W}(w)&{\text{by independence}}\\&=\underbrace {(\lambda e^{-\lambda v})} _{{\text{pdf of}}\;\operatorname {Exp} (\lambda )}\underbrace {\left({\frac {\lambda ^{n}w^{n-1}e^{-\lambda w}}{(n-1)!}}\right)} _{{\text{pdf of}}\operatorname {Gamma} (n,\lambda )}.\end{aligned}}} Let N {\displaystyle N} the number of arrivals within the fixed time interval. The pmf of N {\displaystyle N} is P ( N = n ) = P ( W ≤ t ∩ V + W > t ⏟ V > t − W ) = ∫ 0 t ∫ t − w ∞ f ( v , w ) ⏟ joint pdf of ( V , W ) d v d w = ∫ 0 t ∫ t − w ∞ ( λ e − λ v ) ( λ n w n − 1 e − λ w ( n − 1 ) ! ) d v d w = ∫ 0 t λ n w n − 1 e − λ w ( n − 1 ) ! ∫ t − w ∞ λ e − λ v d v d w = λ n ( n − 1 ) ! ∫ 0 t w n − 1 e − λ w ( 0 − ( − e − λ ( t − w ) ) ) d w = λ n e − λ t ( n − 1 ) ! ∫ 0 t w n − 1 d w = λ n e − λ t ( n − 1 ) ! ⋅ ( t n n − 0 ) = e − λ t ( λ t ) n n ! {\displaystyle {\begin{aligned}\mathbb {P} (N=n)&=\mathbb {P} (W\leq t\cap \underbrace {V+W>t} _{V>t-W})\\&=\int _{0}^{t}\int _{t-w}^{\infty }\underbrace {f(v,w)} _{{\text{joint pdf of}}\;(V,W)}\,dv\,dw\\&=\int _{0}^{t}\int _{t-w}^{\infty }(\lambda e^{-\lambda v})\left({\frac {\lambda ^{n}w^{n-1}e^{-\lambda w}}{(n-1)!}}\right)\,dv\,dw\\&=\int _{0}^{t}{\frac {\lambda ^{n}w^{n-1}e^{-\lambda w}}{(n-1)!}}\int _{t-w}^{\infty }\lambda e^{-\lambda v}\,dv\,dw\\&={\frac {\lambda ^{n}}{(n-1)!}}\int _{0}^{t}w^{n-1}{\cancel {e^{-\lambda w}}}(0-(-e^{-\lambda (t{\cancel {-w}})}))\,dw\\&={\frac {\lambda ^{n}{\color {green}e^{-\lambda t}}}{(n-1)!}}\int _{0}^{t}w^{n-1}\,dw\\&={\frac {\lambda ^{n}e^{-\lambda t}}{(n-1)!}}\cdot \left({\frac {t^{n}}{n}}-0\right)\\&={\frac {e^{-\lambda t}(\lambda t)^{n}}{n!}}\end{aligned}}} which is the pmf of Pois ( λ t ) {\displaystyle \operatorname {Pois} (\lambda t)} . The result follows.
◻ {\displaystyle \Box }
命题。 (第一个到达时间, n {\displaystyle n} 个独立的泊松过程)设 T 1 , T 2 , … , T n {\displaystyle T_{1},T_{2},\dotsc ,T_{n}} 是独立的随机变量,且 T i ∼ Exp ( λ i ) {\displaystyle T_{i}\sim \operatorname {Exp} (\lambda _{i})} ,其中 i = 1 , 2 , … , n {\displaystyle i=1,2,\dotsc ,n} 。如果我们定义 T = min { T 1 , … , T n } {\displaystyle T=\min\{T_{1},\dotsc ,T_{n}\}} (这是 n {\displaystyle n} 个独立泊松过程的第一个到达时间),则 T ∼ Exp ( λ 1 + λ 2 + ⋯ + λ n ) {\displaystyle T\sim \operatorname {Exp} (\lambda _{1}+\lambda _{2}+\cdots +\lambda _{n})} .
证明。 对于每个 t > 0 {\displaystyle t>0} , P ( T > t ) = P ( T 1 > t ∩ ⋯ ∩ T n > t ) = P ( T 1 > t ) ⋯ P ( T n > t ) by independence = [ 1 − ( 1 − e − λ 1 t ⏟ cdf of Exp ( λ 1 ) ) ] ⋯ [ 1 − ( 1 − e − λ n t ⏟ cdf of Exp ( λ n ) ) ] = e − t ( λ 1 + ⋯ + λ n ) ⇒ P ( T ≤ t ) = 1 − e − t ( λ 1 + ⋯ + λ n ) ⇒ T ∼ Exp ( λ 1 + λ 2 + ⋯ + λ n ) {\displaystyle {\begin{aligned}&&\mathbb {P} (T>t)&=\mathbb {P} (T_{1}>t\cap \cdots \cap T_{n}>t)\\&&&=\mathbb {P} (T_{1}>t)\cdots \mathbb {P} (T_{n}>t)&{\text{by independence}}\\&&&=[1-(\underbrace {1-e^{-\lambda _{1}t}} _{{\text{cdf of}}\;\operatorname {Exp} (\lambda _{1})})]\cdots [1-(\underbrace {1-e^{-\lambda _{n}t}} _{{\text{cdf of}}\;\operatorname {Exp} (\lambda _{n})})]\\&&&=e^{-t(\lambda _{1}+\cdots +\lambda _{n})}\\&\Rightarrow &\mathbb {P} (T\leq t)&=1-e^{-t(\lambda _{1}+\cdots +\lambda _{n})}\\&\Rightarrow &T&\sim \operatorname {Exp} (\lambda _{1}+\lambda _{2}+\cdots +\lambda _{n})\end{aligned}}}
◻ {\displaystyle \Box }
示例. 假设有两个服务柜台,柜台 A 和 B,它们的服务时间独立,服从速率为 λ {\displaystyle \lambda } 的指数分布。在过去的 10 分钟里,约翰和彼得分别在柜台 A 和 B 接受服务。
首先,你需要等待的服务时间(即约翰或彼得中一人离开柜台的时间)是从现在开始算起的约翰和彼得的服务时间的最小值,它们相互独立,服从速率为 λ {\displaystyle \lambda } 的指数分布。因此,你的 等待时间 服从 速率为 λ + λ = 2 λ {\displaystyle \lambda +\lambda =2\lambda } 的 指数分布 。
假设现在约翰离开柜台 A,而你正在柜台 A 接受服务。那么,你比彼得先离开柜台的概率 是 1 / 2 {\displaystyle 1/2} ,根据 无记忆性 和 对称性 (彼得和你先离开柜台的概率由相同的随机机制控制),这看似违反直觉。