考生将理解关于个体生命参数和非参数死亡模型的关键概念。
考生将能够
- 理解参数生存模型、生命表以及它们之间的关系。
- 给定一个参数生存模型,计算生存和死亡概率、死亡力函数以及未来寿命随机变量的截断和完整矩。
- 识别并应用未来寿命分布和矩的标准精算符号,包括选择和最终函数。
- 给定一个生命表,计算生存和死亡概率、死亡力函数以及未来寿命随机变量的截断和完整矩,必要时使用适当的分数年龄假设。
- 理解并应用选择生命表。
- 识别人口死亡曲线中的常见特征。
在本章讨论的模型中,它描述了个体的生存时间长度(或死亡时间)。因此,死亡时间随机变量将是基本的构建块。
在本节中,我们将讨论死亡时间随机变量的一个特例,其中死亡时间适用于新生儿(即年龄为零的人)。我们将这种随机变量表示为。我们可以观察到也表示死亡年龄,因为年龄是从生命开始计算的。
由于死亡时间随机变量描述的是时间,因此它是一个连续随机变量。此外,时间是非负的,因此死亡时间随机变量的支持(或“域”)是。
为了描述新生儿的死亡时间,我们需要完全确定的分布。有几种方法可以做到这一点。
- 累积分布函数 (cdf):
- 概率密度函数 (pdf): 如果 可微。
- 生存函数
- 死亡力
在学习概率时,您应该已经了解了 cdf 和 pdf,但可能没有学习过生存函数和死亡力。因此,我们将在这里讨论它们。
顾名思义,“生存函数”可能与生存有关。这实际上是正确的。以死亡时间随机变量为例,当新生儿存活了,比如个时间单位,其概率是多少?它是(或,但由于是连续的,所以没有区别)。这个对应于输入的概率实际上就是生存函数,其定义如下。
定义.(生存函数)随机变量的生存函数为。
在金融数学中,你应该学习过利息力,它可以解释为金额函数的相对变化率,由给出,其中符号在金融数学中具有其通常的含义。为什么我们称之为利息力?这是因为利息指的是金额的增加(或正变化)。
我们可以猜测,死亡力是类似定义的,从某种意义上说,它也可以解释为某物的相对变化率。我们知道利息指的是金额的变化,但死亡率指的是什么变化?由于死亡率意味着易受死亡的状态,它指的是生存率的减少(或负变化),并且死亡率“越高”,生存率的减少幅度就越大。回想一下,生存函数在某种程度上与生存率(在一定时间内存活的概率)相关。因此,我们可以利用生存函数来定义死亡率。
但是,利息力和死亡力之间存在差异,即对于利息力,利息指的是金额的增加,而对于死亡力,死亡率指的是生存率的减少。因此,变化方向相反,因此如果我们以完全类似的方式定义死亡力,其值将为负(相对变化率将为负)。为了使死亡力为正,我们可以如下定义死亡力
定义.(死亡力)随机变量的死亡力为。
示例:证明,假设可微。
解:
练习。
之后,我们将介绍一些与生存函数和死亡力相关的命题。
命题.
证明.
命题.
证明。 为简化表达,在下文中我们将对符号进行一些滥用(无穷大是极限意义下的),但推理仍然易于理解。
示例。 已知 服从区间 上的均匀分布,那么 的力率 是多少?
解: 我们有 。因此,
练习。
现在,我们将讨论范围从年龄为零(新生儿)的未来寿命扩展到年龄为 () 的生命。为了方便表达,我们将年龄为 的生命表示为。
类似地,我们将 的未来寿命表示为(回想一下,我们将(新生儿)的未来寿命表示为)。我们**定义** 的分布(数学上,并且相当自然地)为的**条件分布**,**前提是**。
为了理解这一点,请考虑以下推理:参考以下时间轴
death
x T_x |
|---------|-------v
-------------------------
0 x t
|-----------------|
T_0
我们可以观察到,如果(或,但由于是连续的,所以这并不重要),则。
另一方面,如果,我们有以下时间线
death
x |
|-------v-|
-------------------------
0 x t
|-------|
T_0
在这种情况下,不存在,因为这个人无法存活年,因此永远不会达到岁,所以不存在,因此也不存在,即的未来寿命。这表明条件的必要性。
根据这个定义,我们有,,等等。这非常重要,因为它是与相关的概率计算的基础。
对于的概率密度函数(pdf)、累积分布函数(cdf)和生存函数,我们有如下类似的符号
- :的概率密度函数
- :的累积分布函数
- :的生存函数
特别是,对于累积分布函数和生存函数,我们有一些特殊的精算符号,如下所示
在精算符号中,"" 通常指代与死亡相关的概念,而"" 通常指代与生存相关的概念。在此语境下,这是成立的,因为 指代 在 个时间单位内死亡的概率,而 指代 生存 个时间单位的概率。
为简便起见,如果,我们将 写成,并将 写成。
利用 和 之间的关系,我们可以推导出一些对 和 有用的公式,如下所示
命题. 以及。
我们还可以将 的概率密度函数表示如下
命题。 。
证明。 我们有
我们对在岁和岁之间死亡的概率有一种特殊的记号 (),即(因为这与死亡相关,所以这里我们使用"")。因此,根据定义,我们有。我们对的另一个公式给出以下命题。
命题. 。
证明。
示例. 已知新生儿的生存函数为。
(a) 计算。
(b) 计算。
(c) (a) 和 (b) 中的答案是否相同?
解答
(a)
(b)
(c) 它们不相同。
练习。
**截止未来生存期**与前面章节中的未来生存期类似,只是它是**离散的**。
备注.
- 因此,的支持集是所有非负整数的集合。
类似地,我们希望像的情况一样,完全确定的分布。我们可以使用累积分布函数或概率质量函数(pmf)来实现。其pmf由以下命题给出。
证明。的pmf为
证明. 的累积分布函数为
示例. 已知新生儿的生存函数为 。
(a) 通过考虑 ,计算 在 10 年内死亡的概率。
(b) 通过考虑 ,计算 在 10 年内死亡的概率。
(c) (a) 中的概率和 (b) 中的概率哪个更大?
解答
(a) 概率为 。
(b) 概率为
(c) (b) 中的概率较大。
练习。
在生命表中, 和其他函数的不同(整数)年龄 的值都被制成表格。假定这些值基于前面章节中讨论的生存分布。在本节中,我们将讨论生命表中出现的更多函数。
在前面的章节中,我们讨论了一个人的死亡时间随机变量,这里我们将考虑多个人。假设有个新生儿。令指标函数 此外,令 为所有此类指标函数 的和,即。我们可以将 解释为这 个新生儿中,活到 岁的人数。
我们用 表示 的期望值。
命题. .
作为推论,(相对于是常数)。此外,。此外,我们可以使用来计算概率,例如和,如下所示:,因此。在后面涉及生命表中选择年龄(选择表)的部分,我们将使用这些公式根据这样的生命表计算这些概率,以纳入选择的影响。
我们已经讨论了达到年龄的生存者人数,接下来我们将讨论“相反的事情”,即达到年龄的死亡人数(即0岁到岁之间),或者更一般地,在岁和岁之间。
我们将此类死亡人数的期望值表示为。
命题. 。
备注. 类似地,为了简单起见,我们将写为。
除了与人数的生存者和死亡人数的期望值相关的生命表函数和外,我们还将讨论另外两个生命表函数,它们与寿命的期望值相关。
示例. 假设,新生儿的生存函数为。
(a) 什么是 ?
(b) 什么是 和 ?它们相等吗?
解答
(a) 。(也就是说,预期存活到80岁的数量为0。)
(b) 和 。它们相等。
练习。 给定 。
3. (a) 计算 在本例中 ()。(b) 因此,证明 在所有情况下都成立。(c) 直接利用(b),证明 在所有情况下都成立。
解答
(a)
(b)
证明. 从(a)中,我们可以观察到 在所有情况下都成立。因此,,其中最后一个等式来自先前的命题。
(c)
证明. 从(b)中,我们有
生存期望有两种类型:一种是离散的,另一种是连续的,它们分别称为**残存期生存期望**和**完整期生存期望**。
命题. 。
备注.
- 使用类似的证明,我们也可以证明。
- 因此,方差。
命题. 。
证明. 前面的关于的命题在证明中使用了分部积分,我们可以类似地使用求和分部(可以理解为分部积分的离散模拟)进行证明。然而,有一种更简单的方法来证明这个命题,其中求和被适当地“分割”:我们可以观察到这个求和和命题中的求和表示相同的事物,因此结果成立。
备注.
- 利用类似的证明,我们也可以证明(分部求和法)。
- 因此,方差。
练习。 使用“和式拆分”方法证明。
解答
证明。
以下是 和 的递推关系,当我们想要找到 的完全/截短余命时,这些关系式很有用,前提是已知其他年龄(例如 和 )的余命。
我们将以命题的形式陈述这些递推关系,然后对其进行形式化证明。在证明之后,我们将尝试对 的递推关系给出一些直观的解释。
命题。 .
证明。 特别地,我们有 .
对这个递归关系的一个直观解释如下
- 对于左侧, 是 的截尾期望寿命;
- 对于右侧, 是 的剩余期望寿命,我们想要将其“转换”为 的期望寿命。第一步是加上 1,因为这是相对于 的期望寿命,但我们想要从 的角度来看待期望寿命,它比前者年轻 1 岁。但仅仅这一步还不够,因为“” 假设生命已经存活了 年,但对于 ,生命仅被假定存活了 年。因此,我们还需要乘以 存活一年的概率,,以“到达” 。
- 现在,“从 岁开始的期望寿命” 是通过 来计算的。那么“从 岁到 岁的期望寿命” 呢?实际上,当生命在 岁和 岁之间死亡时,。这意味着这种“期望寿命”为零。
命题. .
证明.
练习。 已知 。
先前,我们已经讨论了连续随机变量和离散随机变量。生命表可以确定的分布,因为对于不同的整数,的值可以从生命表中获得。然而,生命表不足以确定的分布,因为当不是整数时,我们不知道的值。因此,为了使用生命表指定的分布,我们需要对分段(非整数)年龄做出一些假设。
在精算科学中,三种假设被广泛使用,即死亡均匀分布(UDD)(或线性插值)、死亡力恒定(或指数插值)和双曲线(或Balducci)假设(或调和插值)。我们将使用生存函数来定义它们,如下所示
定义。 (死亡均匀分布)死亡均匀分布假设假设
定义。 (死亡力恒定)死亡力恒定假设假设
该方程也可以表示为。
定义。 (Balducci假设)Balducci假设假设
Assumptions for fractional ages
在UDD假设下,我们对与死亡率相关的各种概率有一些“良好”且简单的表达式。我们可以通过用假设中提到的等式的右边替换来获得这些表达式。
示例. 在UDD假设下,当时,
对于前面提到的三种假设,每种假设都有一个特别“简洁”和简单的结果,在实践中,我们可以使用这些“简洁”的结果进行计算,而不是应用定义。UDD假设的“简洁”结果在前面的例子中提到:当,。其他两种假设的“简洁”结果如下所示
定理。(常力假设下的显著性质)在常力假设下,。
证明。
定理。 (巴尔杜奇假设下的显著性质) 在巴尔杜奇假设下, 。
证明。
在UDD假设下,一个有趣的结论与两个随机变量的独立性有关。
为了简化符号,从现在开始,我们令 和 ,除非另有说明。
定义一个连续随机变量 为 。也就是说, 是表示 死亡年份中度过的时间的 年分数 的随机变量。例如,如果 ,那么 在死亡年份中生存了半年。
然后, 和 在 UDD 假设下是独立的。这是因为在 UDD 假设下,。此外,我们可以观察到 的累积分布函数为 ,这是区间 上均匀分布的累积分布函数。这意味着在 UDD 假设下, 服从区间 上的均匀分布。因此, 且 。这产生了在 UDD 假设下的结果。
- .
- .
这两个结果为我们提供了一种计算的均值和方差的替代方法,其中计算中仅使用了离散的内容。但是,我们需要注意的是,这些结果是在UDD假设下成立的,因此在没有UDD假设的情况下,我们不能使用这些结果。
练习。(之前练习回顾)在之前的练习中,我们被要求计算给定时的和。以下问题是对此练习的一些进一步问题。
(a) 证明该生存函数满足UDD假设。
(b) 验证。
解答
(a)
(b) 从之前的练习中,我们有 和 。因此,。
在本节中,我们将介绍一些简单的死亡力模型(即死亡率的一些特定分布)。这些模型中的一些可能适用于模拟人类在某些年龄段的死亡率,但人们普遍认为,这些模型中没有一个适用于模拟人类在所有年龄段的死亡率。
事实上,如果我们想使用某种概率分布来模拟人类的死亡率,我们可能需要使用混合分布,因为人类在不同年龄段的死亡率分布方式不同,因此应该在不同的年龄段使用不同的分布。为了选择某些年龄段的合适分布,我们可以根据实际的人类死亡率数据研究相应经验分布的形状,并据此选择合适的分布。例如,如果死亡率在某些年龄段呈指数增长,那么我们可以选择一个死亡力也呈指数增长的分布。
在实践中,为了计算与人类死亡率相关的概率,我们通常使用生命表进行计算。保险公司通常都是这样做的。每个保险公司都有自己的生命表,该生命表基于其客户(可能是其客户)的死亡率数据。由于这种生命表是使用基于过去经验的实际人类死亡率数据构建的,因此生命表通常被认为比特定分布更准确。
然而,拥有一个死亡力模型可以简化与死亡率相关的概率的计算。
示例。 证明在德·莫弗死亡率定律下, (其中 ), 并在 上设置一定的界限。
证明。 在德莫弗死亡率法则下,我们有 ,其中 有一定的范围。
练习。
1. 因此,证明在德莫弗死亡率法则下 。
解答
证明。 根据上述,我们有 ,在德莫弗死亡率法则下。由此可得 。
2. 上述示例中 的范围是什么?
3. 考虑到上述示例, 服从什么分布?
解答
从上面的例子中,累积分布函数 。因此, 服从区间 上的均匀分布。
备注.
- 由此可见,当年龄 增加时,分布类型 不变(仍然是均匀分布),但支撑集的右端点减小。
4. 因此,证明 。
备注.
- Makeham死亡力定律是Gompertz死亡力定律的推广,因为当 时,这两个定律完全相同。
当一个人购买保险公司提供的寿险保单时,他需要向保险公司提供一些个人信息,例如一些关于其健康状况的信息。为了决定是否应该向该人出售保单,保险公司会通过承保流程获取该人提供的信息。对于承保,承保人会检查信息以查看为该人投保的风险是否合适。
如果没有承保,人们很可能只会在他们认为自己很快就会去世时(例如,他们患有非常严重的疾病)才会购买寿险保单,这样他们很可能会提前提出索赔。在这种情况下,保险公司可能需要支付大量资金并在短时间内遭受巨大损失,然后破产。这说明了承保的必要性。
基本上,标题部分中的“选择”源于承保流程,当我们说一个人在岁时被“选择”时,他是在岁时进行了承保(因此,了解有关该个体的最新信息)。由于在该个人进行承保(或选择)时,有一些关于该个人的新信息,因此我们预计他的生存分布会有一些更新,因此他与死亡率相关的概率也会发生变化。因此,我们需要根据选择年龄在精算符号中进行一些更改。
在这种精算符号中,我们通常在选择年龄周围加上方括号,并且下标中的数字相应地发生变化。例如,如果选择年龄为 25,则变为;如果选择年龄为 12,则。
由于当一个人很久以前就进行了承保时,从他进行承保到现在的这段时间里,他的健康状况可能会更差(例如,变老并患有一些新的疾病),因此我们直观地预计,从岁的人进行承保的时间过去的时间越长,该人在未来一年中死亡的可能性就越大。也就是说, [1]。
选择年龄对生存分布的影响,随着从选择时间过去的时间推移可能会减弱。超过一定的时间段,比如年,在相同已生存年龄(即选择年龄加上从选择到现在过去的时间)但不同选择年龄下的将非常接近。换句话说,(对的条件是为了确保左侧的选择年龄)[2]。这样的年被称为选择期。因为上述将非常接近,所有这些将只写成,不带任何方括号(因为选择的效应基本上“消失了”,所以方括号也消失了)。例如,如果选择期为2年,则和都将简单地写成。但是,我们不会将和写成,因为这两个由于选择的影响仍然“相当大”,所以是“相当不同的”。
以下是与生命表相关的一些术语。
- 一个总生命表是一个生命表,其中函数仅针对已生存年龄给出。
- 一个选择生命表是一个生命表,其中某些函数涉及选择年龄。
- 一个最终生命表通常作为最后一列附加到选择生命表中,以反映选择生命表的设置。以这种方式组合选择生命表和最终生命表被称为选择与最终生命表。
例如,选择与最终生命表(选择期为2年)的摘录可能如下所示
选择期为2年的选择与最终生命表
选择年龄, |
|
|
|
0 |
|
|
|
1 |
|
|
|
2 |
|
|
|
... |
... |
... |
...
|
最后一列是最终表格。我们可以观察到,对于等,我们不需要额外的列,因为我们已经可以在“”值的不同行(具有不同的)中获得这些值。
给定一个选择与最终表,我们可以基于它进行各种计算。
示例。 给定一个(假设的)选择与最终生命表的一部分,选择期为 4 年: 然后,,,以及 [3](因为选择期为 4 年)。
练习。
- ↑ 方括号内的数字是整数,因为它表示年龄。
- ↑ (可选) 更准确地说,选择期是最小的整数,使得 ( 是一个小的正常数。当它越小时,要求越“严格”,而的值将“更接近”。) 对于每个。
- ↑ 的值取自,其中。