考生将理解关于个体生命参数和非参数死亡模型的关键概念。
考生将能够
- 理解参数生存模型、生命表以及它们之间的关系。
- 给定一个参数生存模型,计算生存和死亡概率、死亡力函数以及未来寿命随机变量的截断和完整矩。
- 识别并应用未来寿命分布和矩的标准精算符号,包括选择和最终函数。
- 给定一个生命表,计算生存和死亡概率、死亡力函数以及未来寿命随机变量的截断和完整矩,必要时使用适当的分数年龄假设。
- 理解并应用选择生命表。
- 识别人口死亡曲线中的常见特征。
在本章讨论的模型中,它描述了个体的生存时间长度(或死亡时间)。因此,死亡时间随机变量将是基本的构建块。
在本节中,我们将讨论死亡时间随机变量的一个特例,其中死亡时间适用于新生儿(即年龄为零的人)。我们将这种随机变量表示为
。我们可以观察到
也表示死亡年龄,因为年龄是从生命开始计算的。
由于死亡时间随机变量描述的是时间,因此它是一个连续随机变量。此外,时间是非负的,因此死亡时间随机变量的支持(或“域”)是
。
为了描述新生儿的死亡时间,我们需要完全确定
的分布。有几种方法可以做到这一点。
- 累积分布函数 (cdf):

- 概率密度函数 (pdf):
如果
可微。
- 生存函数
- 死亡力
在学习概率时,您应该已经了解了 cdf 和 pdf,但可能没有学习过生存函数和死亡力。因此,我们将在这里讨论它们。
顾名思义,“生存函数”可能与生存有关。这实际上是正确的。以死亡时间随机变量
为例,当新生儿存活了,比如
个时间单位,其概率是多少?它是
(或
,但由于
是连续的,所以没有区别)。这个对应于输入
的概率实际上就是生存函数,其定义如下。
定义.(生存函数)随机变量
的生存函数为
。
在金融数学中,你应该学习过利息力,它可以解释为金额函数的相对变化率,由
给出,其中符号在金融数学中具有其通常的含义。为什么我们称之为利息力?这是因为利息指的是金额的增加(或正变化)。
我们可以猜测,死亡力是类似定义的,从某种意义上说,它也可以解释为某物的相对变化率。我们知道利息指的是金额的变化,但死亡率指的是什么变化?由于死亡率意味着易受死亡的状态,它指的是生存率的减少(或负变化),并且死亡率“越高”,生存率的减少幅度就越大。回想一下,生存函数在某种程度上与生存率(在一定时间内存活的概率)相关。因此,我们可以利用生存函数来定义死亡率。
但是,利息力和死亡力之间存在差异,即对于利息力,利息指的是金额的增加,而对于死亡力,死亡率指的是生存率的减少。因此,变化方向相反,因此如果我们以完全类似的方式定义死亡力,其值将为负(相对变化率将为负)。为了使死亡力为正,我们可以如下定义死亡力
定义.(死亡力)随机变量
的死亡力为
。
示例:证明
,假设
可微。
解: 
练习。
之后,我们将介绍一些与生存函数和死亡力相关的命题。
命题. 
证明. ![{\displaystyle {\begin{aligned}\exp \left(-\int _{0}^{t}\mu _{x}\,dx\right)&=\exp \left({\color {darkgreen}-}\int _{0}^{t}{\frac {{\color {darkgreen}-}S'_{0}(x)}{S_{0}(x)}}\,dx\right)\\&=\exp \left(\int _{0}^{t}{\frac {\color {red}S'_{0}(x)}{S_{0}(x)}}\,{\color {red}dx}\right)\\&=\exp \left(\int _{0}^{t}{\frac {1}{S_{0}(x)}}\,{\color {red}d(S_{0}(x))}\right)\\&=\exp \left([\ln |\underbrace {S_{0}(x)} _{\geq 0}|]_{0}^{t}\right)\\&=\exp \left(\ln(S_{0}(t))-\ln(\underbrace {S_{0}(0)} _{=1})\right)\\&=\exp \left(\ln(S_{0}(t))-\underbrace {\ln 1} _{=0}\right)\\&=\exp \left(\ln(S_{0}(t))\right)\\&=S_{0}(t),\end{aligned}}}</span> 如预期的那样。</p><p><span style=](https://wikimedia.org/api/rest_v1/media/math/render/svg/013cb98b5509daaa2281b25835a355444d4dd4c2)
命题. 
证明。 为简化表达,在下文中我们将对符号进行一些滥用(无穷大是极限意义下的),但推理仍然易于理解。 ![{\displaystyle {\begin{aligned}\int _{0}^{\infty }\mu _{t}\,dt&=[\ln(S_{0}(t))]_{0}^{\infty }\\&=\ln S_{0}(\infty )-\ln S_{0}(0)\\&=\ln 0\\&=\infty .\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/741fa736cb41b72e969b0d214ba68b9797a2b5ca)
示例。 已知
服从区间
上的均匀分布,那么
的力率
是多少?
解: 我们有
。因此, 
练习。
现在,我们将讨论范围从年龄为零(新生儿)的未来寿命扩展到年龄为
(
) 的生命。为了方便表达,我们将年龄为
的生命表示为
。
类似地,我们将
的未来寿命表示为
(回想一下,我们将
(新生儿)的未来寿命表示为
)。我们**定义**
的分布(数学上,并且相当自然地)为
的**条件分布**,**前提是**
。
为了理解这一点,请考虑以下推理:参考以下时间轴
death
x T_x |
|---------|-------v
-------------------------
0 x t
|-----------------|
T_0
我们可以观察到,如果
(或
,但由于
是连续的,所以这并不重要),则
。
另一方面,如果
,我们有以下时间线
death
x |
|-------v-|
-------------------------
0 x t
|-------|
T_0
在这种情况下,
不存在,因为这个人无法存活
年,因此永远不会达到
岁,所以不存在
,因此也不存在
,即
的未来寿命。这表明条件
的必要性。
根据这个定义,我们有
,
,等等。这非常重要,因为它是与
相关的概率计算的基础。
对于
的概率密度函数(pdf)、累积分布函数(cdf)和生存函数,我们有如下类似的符号
:
的概率密度函数
:
的累积分布函数
:
的生存函数
特别是,对于累积分布函数和生存函数,我们有一些特殊的精算符号,如下所示


在精算符号中,"
" 通常指代与死亡相关的概念,而"
" 通常指代与生存相关的概念。在此语境下,这是成立的,因为
指代
在
个时间单位内死亡的概率,而
指代
生存
个时间单位的概率。
为简便起见,如果
,我们将
写成
,并将
写成
。
利用
和
之间的关系,我们可以推导出一些对
和
有用的公式,如下所示
命题.
以及
。
我们还可以将
的概率密度函数表示如下
命题。
。
证明。 我们有 
我们对
在
岁和
岁之间死亡的概率有一种特殊的记号 (
),即
(因为这与死亡相关,所以这里我们使用"
")。因此,根据定义,我们有
。我们对
的另一个公式给出以下命题。
命题.
。
证明。 
示例. 已知新生儿的生存函数为
。
(a) 计算
。
(b) 计算
。
(c) (a) 和 (b) 中的答案是否相同?
解答
(a) 
(b) 
(c) 它们不相同。
练习。
**截止未来生存期**与前面章节中的未来生存期类似,只是它是**离散的**。
备注.
- 因此,
的支持集是所有非负整数的集合。
类似地,我们希望像
的情况一样,完全确定
的分布。我们可以使用累积分布函数或概率质量函数(pmf)来实现。其pmf由以下命题给出。
证明。
的pmf为
证明.
的累积分布函数为 
示例. 已知新生儿的生存函数为
。
(a) 通过考虑
,计算
在 10 年内死亡的概率。
(b) 通过考虑
,计算
在 10 年内死亡的概率。
(c) (a) 中的概率和 (b) 中的概率哪个更大?
解答
(a) 概率为
。
(b) 概率为 
(c) (b) 中的概率较大。
练习。
在生命表中,
和其他函数的不同(整数)年龄
的值都被制成表格。假定这些值基于前面章节中讨论的生存分布。在本节中,我们将讨论生命表中出现的更多函数。
在前面的章节中,我们讨论了一个人的死亡时间随机变量,这里我们将考虑多个人。假设有
个新生儿。令指标函数
此外,令
为所有此类指标函数
的和,即
。我们可以将
解释为这
个新生儿中,活到
岁的人数。
我们用
表示
的期望值。
命题.
.
作为推论,
(
相对于
是常数)。此外,
。此外,我们可以使用
来计算概率,例如
和
,如下所示:
,因此
。在后面涉及生命表中选择年龄(选择表)的部分,我们将使用这些公式根据这样的生命表计算这些概率,以纳入选择的影响。
我们已经讨论了达到
年龄的生存者人数,接下来我们将讨论“相反的事情”,即达到
年龄的死亡人数(即0岁到
岁之间),或者更一般地,在
岁和
岁之间。
我们将此类死亡人数的期望值表示为
。
命题.
。
备注. 类似地,为了简单起见,我们将
写为
。
除了与人数的生存者和死亡人数的期望值相关的生命表函数
和
外,我们还将讨论另外两个生命表函数,它们与寿命的期望值相关。
示例. 假设
,新生儿的生存函数为
。
(a) 什么是
?
(b) 什么是
和
?它们相等吗?
解答
(a)
。(也就是说,预期存活到80岁的数量为0。)
(b)
和
。它们相等。
练习。 给定
。
3. (a) 计算
在本例中 (
)。(b) 因此,证明
在所有情况下都成立。(c) 直接利用(b),证明
在所有情况下都成立。
解答
(a) 
(b)
证明. 从(a)中,我们可以观察到
在所有情况下都成立。因此,
,其中最后一个等式来自先前的命题。
(c)
证明. 从(b)中,我们有
生存期望有两种类型:一种是离散的,另一种是连续的,它们分别称为**残存期生存期望**和**完整期生存期望**。
命题.
。
备注.
- 使用类似的证明,我们也可以证明
。
- 因此,方差
。
命题.
。
证明. 前面的关于
的命题在证明中使用了分部积分,我们可以类似地使用求和分部(可以理解为分部积分的离散模拟)进行证明。然而,有一种更简单的方法来证明这个命题,其中求和被适当地“分割”:
我们可以观察到这个求和和命题中的求和表示相同的事物,因此结果成立。
备注.
- 利用类似的证明,我们也可以证明
(分部求和法)。
- 因此,方差
。
练习。 使用“和式拆分”方法证明
。
解答
证明。 ![{\displaystyle {\begin{aligned}\mathbb {E} [K_{x}^{2}]&=\sum _{k=0}^{\infty }k^{2}{}_{k}p_{x}q_{x+k}\\&=\sum _{k=0}^{\infty }k^{2}({}_{k}p_{x}-{}_{k+1}p_{x})\\&=\sum _{k={\color {darkgreen}1}}^{\infty }k^{2}{}_{k}p_{x}-\sum _{k=0}^{\infty }k^{2}{}_{k+1}p_{x}&(k^{2}{}_{k}p_{x}{\text{ when }}k=0)\\&=\sum _{k={\color {darkgreen}1}}^{\infty }k^{2}{}_{k}p_{x}-\sum _{k'=1}^{\infty }(k'-1)^{2}{}_{k'}p_{x}&(k'=k+1)\\&=\underbrace {\sum _{k={\color {darkgreen}1}}^{\infty }k^{2}{}_{k}p_{x}-\sum _{k'=1}^{\infty }k'^{2}{}_{k'}p_{x}} _{=0}+\sum _{k'=1}^{\infty }(2k'-1){}_{k'}p_{x}&(-(k'-1)^{2}=-k'+2k'-1)\\&=\sum _{k'=1}^{\infty }(2k'-1){}_{k'}p_{x}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/811e1d2691a2523e0a0730b3e0d0445faeab69e3)
以下是
和
的递推关系,当我们想要找到
的完全/截短余命时,这些关系式很有用,前提是已知其他年龄(例如
和
)的余命。
我们将以命题的形式陈述这些递推关系,然后对其进行形式化证明。在证明之后,我们将尝试对
的递推关系给出一些直观的解释。
命题。
.
证明。
特别地,我们有
.
对这个递归关系的一个直观解释如下
- 对于左侧,
是
的截尾期望寿命;
- 对于右侧,
是
的剩余期望寿命,我们想要将其“转换”为
的期望寿命。第一步是加上 1,因为这是相对于
的期望寿命,但我们想要从
的角度来看待期望寿命,它比前者年轻 1 岁。但仅仅这一步还不够,因为“
” 假设生命已经存活了
年,但对于
,生命仅被假定存活了
年。因此,我们还需要乘以
存活一年的概率,
,以“到达”
。
- 现在,“从
岁开始的期望寿命” 是通过
来计算的。那么“从
岁到
岁的期望寿命” 呢?实际上,当生命在
岁和
岁之间死亡时,
。这意味着这种“期望寿命”为零。
命题.
.
证明. 
练习。 已知
。
先前,我们已经讨论了连续随机变量
和离散随机变量
。生命表可以确定
的分布,因为对于不同的整数
,
的值可以从生命表中获得。然而,生命表不足以确定
的分布,因为当
不是整数时,我们不知道
的值。因此,为了使用生命表指定
的分布,我们需要对分段(非整数)年龄做出一些假设。
在精算科学中,三种假设被广泛使用,即死亡均匀分布(UDD)(或线性插值)、死亡力恒定(或指数插值)和双曲线(或Balducci)假设(或调和插值)。我们将使用生存函数来定义它们,如下所示
定义。 (死亡均匀分布)死亡均匀分布假设假设
定义。 (死亡力恒定)死亡力恒定假设假设
该方程也可以表示为
。
定义。 (Balducci假设)Balducci假设假设
Assumptions for fractional ages
在UDD假设下,我们对与死亡率相关的各种概率有一些“良好”且简单的表达式。我们可以通过用假设中提到的等式的右边替换
来获得这些表达式。
示例. 在UDD假设下,当
时,
对于前面提到的三种假设,每种假设都有一个特别“简洁”和简单的结果,在实践中,我们可以使用这些“简洁”的结果进行计算,而不是应用定义。UDD假设的“简洁”结果在前面的例子中提到:当
,
。其他两种假设的“简洁”结果如下所示
定理。(常力假设下的显著性质)在常力假设下,
。
证明。 ![{\displaystyle _{t}p_{x}={\frac {S_{0}(x+t)}{S_{0}(x)}}={\frac {[S_{0}(x)]^{1-t}[S_{0}(x+1)]^{t}}{S_{0}(x)}}={\frac {[S_{0}(x+1)]^{t}}{[S_{0}(x)]^{t}}}=\left({\frac {S_{0}(x+1)}{S_{0}(x)}}\right)^{t}=p_{x}^{t}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/041987a946a4843bbd467a163feca15bc360f553)
定理。 (巴尔杜奇假设下的显著性质) 在巴尔杜奇假设下,
。
证明。 
在UDD假设下,一个有趣的结论与两个随机变量的独立性有关。
为了简化符号,从现在开始,我们令
和
,除非另有说明。
定义一个连续随机变量
为
。也就是说,
是表示
死亡年份中度过的时间的 年分数 的随机变量。例如,如果
,那么
在死亡年份中生存了半年。
然后,
和
在 UDD 假设下是独立的。这是因为在 UDD 假设下,
。此外,我们可以观察到
的累积分布函数为
,这是区间
上均匀分布的累积分布函数。这意味着在 UDD 假设下,
服从区间
上的均匀分布。因此,
且
。这产生了在 UDD 假设下的结果。
.
.
这两个结果为我们提供了一种计算
的均值和方差的替代方法,其中计算中仅使用了离散的内容。但是,我们需要注意的是,这些结果是在UDD假设下成立的,因此在没有UDD假设的情况下,我们不能使用这些结果。
练习。(之前练习回顾)在之前的练习中,我们被要求计算给定
时的
和
。以下问题是对此练习的一些进一步问题。
(a) 证明该生存函数满足UDD假设。
(b) 验证
。
解答
(a)
(b) 从之前的练习中,我们有
和
。因此,
。
在本节中,我们将介绍一些简单的死亡力模型(即死亡率的一些特定分布)。这些模型中的一些可能适用于模拟人类在某些年龄段的死亡率,但人们普遍认为,这些模型中没有一个适用于模拟人类在所有年龄段的死亡率。
事实上,如果我们想使用某种概率分布来模拟人类的死亡率,我们可能需要使用混合分布,因为人类在不同年龄段的死亡率分布方式不同,因此应该在不同的年龄段使用不同的分布。为了选择某些年龄段的合适分布,我们可以根据实际的人类死亡率数据研究相应经验分布的形状,并据此选择合适的分布。例如,如果死亡率在某些年龄段呈指数增长,那么我们可以选择一个死亡力也呈指数增长的分布。
在实践中,为了计算与人类死亡率相关的概率,我们通常使用生命表进行计算。保险公司通常都是这样做的。每个保险公司都有自己的生命表,该生命表基于其客户(可能是其客户)的死亡率数据。由于这种生命表是使用基于过去经验的实际人类死亡率数据构建的,因此生命表通常被认为比特定分布更准确。
然而,拥有一个死亡力模型可以简化与死亡率相关的概率的计算。
示例。 证明在德·莫弗死亡率定律下,
(其中
), 并在
上设置一定的界限。
证明。 在德莫弗死亡率法则下,我们有
,其中
有一定的范围。
练习。
1. 因此,证明在德莫弗死亡率法则下
。
解答
证明。 根据上述,我们有
,在德莫弗死亡率法则下。由此可得
。
2. 上述示例中
的范围是什么?
3. 考虑到上述示例,
服从什么分布?
解答
从上面的例子中,累积分布函数
。因此,
服从区间
上的均匀分布。
备注.
- 由此可见,当年龄
增加时,分布类型 不变(仍然是均匀分布),但支撑集的右端点减小。
4. 因此,证明
。
备注.
- Makeham死亡力定律是Gompertz死亡力定律的推广,因为当
时,这两个定律完全相同。
当一个人购买保险公司提供的寿险保单时,他需要向保险公司提供一些个人信息,例如一些关于其健康状况的信息。为了决定是否应该向该人出售保单,保险公司会通过承保流程获取该人提供的信息。对于承保,承保人会检查信息以查看为该人投保的风险是否合适。
如果没有承保,人们很可能只会在他们认为自己很快就会去世时(例如,他们患有非常严重的疾病)才会购买寿险保单,这样他们很可能会提前提出索赔。在这种情况下,保险公司可能需要支付大量资金并在短时间内遭受巨大损失,然后破产。这说明了承保的必要性。
基本上,标题部分中的“选择”源于承保流程,当我们说一个人在
岁时被“选择”时,他是在
岁时进行了承保(因此,了解有关该个体的最新信息)。由于在该个人进行承保(或选择)时,有一些关于该个人的新信息,因此我们预计他的生存分布会有一些更新,因此他与死亡率相关的概率也会发生变化。因此,我们需要根据选择年龄在精算符号中进行一些更改。
在这种精算符号中,我们通常在选择年龄周围加上方括号,并且下标中的数字相应地发生变化。例如,如果选择年龄为 25,则
变为
;如果选择年龄为 12,则
。
由于当一个人很久以前就进行了承保时,从他进行承保到现在的这段时间里,他的健康状况可能会更差(例如,变老并患有一些新的疾病),因此我们直观地预计,从
岁的人进行承保的时间过去的时间越长,该人在未来一年中死亡的可能性就越大。也就是说,
[1]。
选择年龄对生存分布的影响,随着从选择时间过去的时间推移可能会减弱。超过一定的时间段,比如
年,在相同已生存年龄(即选择年龄加上从选择到现在过去的时间)但不同选择年龄下的
将非常接近。换句话说,
(对
的条件是为了确保左侧的选择年龄
)[2]。这样的
年被称为选择期。因为上述
将非常接近,所有这些
将只写成
,不带任何方括号(因为选择的效应基本上“消失了”,所以方括号也消失了)。例如,如果选择期为2年,则
和
都将简单地写成
。但是,我们不会将
和
写成
,因为这两个
由于选择的影响仍然“相当大”,所以是“相当不同的”。
以下是与生命表相关的一些术语。
- 一个总生命表是一个生命表,其中函数仅针对已生存年龄给出。
- 一个选择生命表是一个生命表,其中某些函数涉及选择年龄。
- 一个最终生命表通常作为最后一列附加到选择生命表中,以反映选择生命表的设置。以这种方式组合选择生命表和最终生命表被称为选择与最终生命表。
例如,选择与最终生命表(选择期为2年)的摘录可能如下所示
选择期为2年的选择与最终生命表
选择年龄, |
![{\displaystyle q_{[x]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/038fdbbbe02bd46a52f835bdc49ac30ac5f6025e) |
|
|
0 |
![{\displaystyle q_{[0]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c1f40400e0c1c28dff090961c79b915f0ef01946) |
![{\displaystyle q_{[0]+1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3f430f0b65c49ecc4f8dd866ffdb88b7dace785c) |
|
1 |
![{\displaystyle q_{[1]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40c0572280fd54acd930471f7b70187c428a84b8) |
![{\displaystyle q_{[1]+1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8081f3a7834f4323af0b71d1fd6524d4e46a61b8) |
|
2 |
![{\displaystyle q_{[2]}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e4e0597071a37876332f66d61bbae8c7db4d8cab) |
![{\displaystyle q_{[2]+1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/07791b2c0d459bb9fe6e490b0da3187c54c805e0) |
|
... |
... |
... |
...
|
最后一列是最终表格。我们可以观察到,对于
等,我们不需要额外的列,因为我们已经可以在“
”值的不同行(具有不同的
)中获得这些值。
给定一个选择与最终表,我们可以基于它进行各种计算。
示例。 给定一个(假设的)选择与最终生命表的一部分,选择期为 4 年:
然后,
,
,以及
[3](因为选择期为 4 年)。
练习。
- ↑ 方括号内的数字是整数,因为它表示年龄。
- ↑ (可选) 更准确地说,选择期是最小的整数
,使得
(
是一个小的正常数。当它越小时,要求越“严格”,而
的值将“更接近”。) 对于每个
。
- ↑
的值取自
,其中
。