跳转至内容

精算数学基础/死亡模型

来自Wikibooks,开放世界中的开放书籍

学习目标

[编辑 | 编辑源代码]

考生将理解关于个体生命参数和非参数死亡模型的关键概念。

学习成果

[编辑 | 编辑源代码]

考生将能够

  1. 理解参数生存模型、生命表以及它们之间的关系。
  2. 给定一个参数生存模型,计算生存和死亡概率、死亡力函数以及未来寿命随机变量的截断和完整矩。
  3. 识别并应用未来寿命分布和矩的标准精算符号,包括选择和最终函数。
  4. 给定一个生命表,计算生存和死亡概率、死亡力函数以及未来寿命随机变量的截断和完整矩,必要时使用适当的分数年龄假设。
  5. 理解并应用选择生命表。
  6. 识别人口死亡曲线中的常见特征。

生存分布

[编辑 | 编辑源代码]

在本章讨论的模型中,它描述了个体的生存时间长度(或死亡时间)。因此,死亡时间随机变量将是基本的构建块。

死亡年龄随机变量

[编辑 | 编辑源代码]

在本节中,我们将讨论死亡时间随机变量的一个特例,其中死亡时间适用于新生儿(即年龄为零的人)。我们将这种随机变量表示为。我们可以观察到也表示死亡年龄,因为年龄是从生命开始计算的。

由于死亡时间随机变量描述的是时间,因此它是一个连续随机变量。此外,时间是非负的,因此死亡时间随机变量的支持(或“域”)是

为了描述新生儿的死亡时间,我们需要完全确定的分布。有几种方法可以做到这一点。

  • 累积分布函数 (cdf):
  • 概率密度函数 (pdf): 如果 可微。
  • 生存函数
  • 死亡力

在学习概率时,您应该已经了解了 cdf 和 pdf,但可能没有学习过生存函数和死亡力。因此,我们将在这里讨论它们。

生存函数

[编辑 | 编辑源代码]

顾名思义,“生存函数”可能与生存有关。这实际上是正确的。以死亡时间随机变量为例,当新生儿存活了,比如个时间单位,其概率是多少?它是(或,但由于是连续的,所以没有区别)。这个对应于输入的概率实际上就是生存函数,其定义如下。

定义.(生存函数)随机变量生存函数

备注.

  • 作为推论,
  • 我们可以看到给出了新生儿在个时间单位内死亡的概率。
  • 由于是一个非递减函数,是一个非递增函数。
  • 对于的生存函数,我们用表示,它等于

  • 如果,则,因为支撑集是的子集,所以这个事件已经“覆盖”了整个支撑集。

示例. 回忆一下,速率为的指数分布的累积分布函数为。因此,速率为的指数分布的生存函数为

死亡力

[编辑 | 编辑源代码]

在金融数学中,你应该学习过利息力,它可以解释为金额函数的相对变化率,由给出,其中符号在金融数学中具有其通常的含义。为什么我们称之为利息力?这是因为利息指的是金额的增加(或正变化)。

我们可以猜测,死亡力是类似定义的,从某种意义上说,它也可以解释为某物的相对变化率。我们知道利息指的是金额的变化,但死亡率指的是什么变化?由于死亡率意味着易受死亡的状态,它指的是生存率的减少(或负变化),并且死亡率“越高”,生存率的减少幅度就越大。回想一下,生存函数在某种程度上与生存率(在一定时间内存活的概率)相关。因此,我们可以利用生存函数来定义死亡率。

但是,利息力和死亡力之间存在差异,即对于利息力,利息指的是金额的增加,而对于死亡力,死亡率指的是生存率的减少。因此,变化方向相反,因此如果我们以完全类似的方式定义死亡力,其值将为负(相对变化率将为负)。为了使死亡力为正,我们可以如下定义死亡力

定义.(死亡力)随机变量死亡力

备注.

  • 对于直到死亡时间的随机变量的死亡力,用表示,等于
  • 如果,由于始终成立,,因此
  • 如果,由于是非增的,其导数是非正的,因此其负值是非负的。同时,(因为生存函数是一个概率)。因此,
  • 在时间点的死亡力表示新生儿在时间的生存率的相对下降率。

示例:证明,假设可微。

解:

备注.

  • 我们可以将(大致)解释为新生儿在时间“瞬间”死亡的条件概率,前提是新生儿存活了个时间单位,因为很小,接近于零)。
  • 这种解释很直观,因为在时间的“瞬间”死亡率可以解释为在时间生存率下降的相对速率(当该时间点的“瞬间”死亡率很高时,该时间点的相对生存率下降很多)。
Clipboard

练习。

以速率的指数分布的死亡力是多少?

1
-1


之后,我们将介绍一些与生存函数死亡力相关的命题。

命题.

证明.

命题.

证明。 为简化表达,在下文中我们将对符号进行一些滥用(无穷大是极限意义下的),但推理仍然易于理解。

示例。 已知 服从区间 上的均匀分布,那么 的力率 是多少?

解: 我们有 。因此,

Clipboard

练习。

假设 的力率为 。新生儿在 10 年内死亡的概率是多少?

0.368
0.393
0.607
0.632




年龄为 x 的人的未来寿命

[编辑 | 编辑源代码]

现在,我们将讨论范围从年龄为零(新生儿)的未来寿命扩展到年龄为 () 的生命。为了方便表达,我们将年龄为 的生命表示为

备注.

  • 当我们说“年龄为的生命”时,是指生命**正好**为岁,即生命刚刚达到岁(生命的生日),而不是,比如说岁,岁等,这些在日常生活中通常也被称为“岁”。

类似地,我们将 的未来寿命表示为(回想一下,我们将(新生儿)的未来寿命表示为)。我们**定义** 的分布(数学上,并且相当自然地)为的**条件分布**,**前提是**

为了理解这一点,请考虑以下推理:参考以下时间轴

                  death
    x       T_x   |
|---------|-------v
-------------------------
0         x                 t
|-----------------|
      T_0

我们可以观察到,如果(或,但由于是连续的,所以这并不重要),则

另一方面,如果,我们有以下时间线

      death       
    x   |       
|-------v-|
-------------------------
0         x                 t
|-------|
   T_0

在这种情况下,不存在,因为这个人无法存活年,因此永远不会达到岁,所以不存在,因此也不存在,即的未来寿命。这表明条件的必要性。

根据这个定义,我们有,等等。这非常重要,因为它是与相关的概率计算的基础。

对于的概率密度函数(pdf)、累积分布函数(cdf)和生存函数,我们有如下类似的符号

  • 的概率密度函数
  • 的累积分布函数
  • 的生存函数

特别是,对于累积分布函数和生存函数,我们有一些特殊的精算符号,如下所示

在精算符号中,"" 通常指代与死亡相关的概念,而"" 通常指代与生存相关的概念。在此语境下,这是成立的,因为 指代 个时间单位内死亡的概率,而 指代 生存 个时间单位的概率。

为简便起见,如果,我们将 写成,并将 写成

利用 之间的关系,我们可以推导出一些对 有用的公式,如下所示

命题. 以及

证明。 首先,我们有 ,其中 ,因为 (),因此 ,从而 的子集。

由此可得

我们还可以将 的概率密度函数表示如下

命题。

证明。 我们有

备注.

  • 直观地(并且粗略地), 给出了 存活 个时间单位的概率,并且之后 变成了 ,并且 给出了 在时间 “瞬间”死亡的概率,前提是该人在 个时间单位内存活下来。将 相乘,其含义与 的(粗略)解释相同: 在时间 之后很短时间内(或“恰好”在时间 )死亡。

例题. 已知新生儿的生存函数为

(a) 计算。因此,确定 是否成立。

(b) 计算。因此,计算

解答

(a) 以及 。由于

(b) 由于。所以,

Clipboard

练习。



我们对岁和岁之间死亡的概率有一种特殊的记号 (),即(因为这与死亡相关,所以这里我们使用"")。因此,根据定义,我们有。我们对的另一个公式给出以下命题。

命题.

证明。

备注.

  • 对于证明类似这样的公式,通常最好在中间步骤中将所有"" 更改为"",因为"" 通常比"" 更易于处理。

  • 为了更直观地理解这一点, 可以解释为 存活 个时间单位的概率,前提是 存活了 个时间单位,并且 可以解释为 个时间单位内死亡的概率,前提是 存活了 个时间单位。因此,将这两个概率相乘,可以得到 个时间单位内死亡并且 存活了 个时间单位,前提是 存活了 个时间单位的概率。
  • 此论证对应于上述证明中的

  • 如果我们将上面蓝色事件表示为橙色事件表示为,以及紫色事件表示为,我们可以使用概率符号表示上述论证:
  • 当您尝试证明这个等式时,您可以观察到这等价于上述证明中的
  • 类似地,为了简便起见,我们将表示为

示例. 已知新生儿的生存函数为

(a) 计算

(b) 计算

(c) (a) 和 (b) 中的答案是否相同?

解答

(a)

(b)

(c) 它们相同。

Clipboard

练习。

1 以下哪个/哪些表达式表示在10岁到12岁之间死亡的概率?

2 以下哪个/哪些表达式表示在10岁到12岁之间存活的概率?



年龄为x的生存体的**截止未来生存期**

[编辑 | 编辑源代码]

**截止未来生存期**与前面章节中的未来生存期类似,只是它是**离散的**。

定义。(截止未来生存期)年龄为的生存体的**截止未来生存期**,记为,是,即的**向下取整函数**。

备注.

  • 因此,的支持集是所有非负整数的集合。

类似地,我们希望像的情况一样,完全确定的分布。我们可以使用累积分布函数或概率质量函数(pmf)来实现。其pmf由以下命题给出。

命题。的pmf)的pmf为

证明。的pmf为

命题. 的累积分布函数) 的累积分布函数为

证明. 的累积分布函数为

示例. 已知新生儿的生存函数为

(a) 通过考虑 ,计算 在 10 年内死亡的概率。

(b) 通过考虑 ,计算 在 10 年内死亡的概率。

(c) (a) 中的概率和 (b) 中的概率哪个更大?

解答

(a) 概率为

(b) 概率为

(c) (b) 中的概率较大。

Clipboard

练习。

1 下列哪一项(或哪些项)是 的生存函数?

2 考虑 ,计算 生存 20 年的概率。

0.65
0.7375
0.75
0.9875




生命表

[编辑 | 编辑源代码]

在生命表中, 和其他函数的不同(整数)年龄 的值都被制成表格。假定这些值基于前面章节中讨论的生存分布。在本节中,我们将讨论生命表中出现的更多函数。

在前面的章节中,我们讨论了一个人的死亡时间随机变量,这里我们将考虑多个人。假设有个新生儿。令指标函数 此外,令 为所有此类指标函数 的和,即。我们可以将 解释为这 个新生儿中,活到 岁的人数。

我们用 表示期望值

命题. .

证明。 由于 (对于每个生命 都成立,因为假设不同生命的未来寿命的生存分布相同), 等于


作为推论,相对于是常数)。此外,。此外,我们可以使用来计算概率,例如,如下所示:,因此。在后面涉及生命表中选择年龄(选择表)的部分,我们将使用这些公式根据这样的生命表计算这些概率,以纳入选择的影响。

我们已经讨论了达到年龄的生存者人数,接下来我们将讨论“相反的事情”,即达到年龄的死亡人数(即0岁到岁之间),或者更一般地,在岁和岁之间。

我们将此类死亡人数的期望值表示为

命题.

证明. 我们可以类似地为该情境定义另一个指示函数(如果生命岁和岁之间死亡,则值为 1,否则为 0)。然后,每个指示函数的期望值等于新生儿在岁和岁之间死亡的概率,即。与上述类似的推理,我们有

备注. 类似地,为了简单起见,我们将写为

除了与人数的生存者和死亡人数的期望值相关的生命表函数外,我们还将讨论另外两个生命表函数,它们与寿命的期望值相关。

示例. 假设,新生儿的生存函数为

(a) 什么是

(b) 什么是 ?它们相等吗?

解答

(a) 。(也就是说,预期存活到80岁的数量为0。)

(b) 。它们相等。

备注.

  • 对于 (b),确实, 对于每个 都成立,因为 对于每个 都成立。
Clipboard

练习。 给定

1 什么是

0.143
0.333
0.667
0.857

2 计算 (i) ;(ii)

(i) 25; (ii) 20
(i) 20; (ii) 20
(i) 20; (ii) 25
(i) 25; (ii) 25


3. (a) 计算 在本例中 ()。(b) 因此,证明 在所有情况下都成立。(c) 直接利用(b),证明 在所有情况下都成立

解答

(a)

(b)

证明. 从(a)中,我们可以观察到 在所有情况下都成立。因此,,其中最后一个等式来自先前的命题。


(c)

证明. 从(b)中,我们有


生存期望有两种类型:一种是离散的,另一种是连续的,它们分别称为**残存期生存期望**和**完整期生存期望**。

定义.(完全期望寿命)完全期望寿命,记为 ,是

定义.(截短期望寿命)截短期望寿命,记为 ,是

命题.

证明。 我们将使用分部积分法。 现在,只需证明 ,这是正确的,因为 时,因此该极限要么等于 ,要么等于 0。但是,由于期望值存在(即不趋于无穷大,否则预期寿命就没有意义),因此该极限不能等于 ,因此该极限为 0。

备注.

  • 使用类似的证明,我们也可以证明
  • 因此,方差

命题.

证明. 前面的关于的命题在证明中使用了分部积分,我们可以类似地使用求和分部(可以理解为分部积分的离散模拟)进行证明。然而,有一种更简单的方法来证明这个命题,其中求和被适当地“分割”:我们可以观察到这个求和和命题中的求和表示相同的事物,因此结果成立。

使用求和分部进行证明

本证明的思路与关于命题的证明类似,不同之处在于分部积分被替换为分部求和(可以将其理解为分部积分的“离散版本”)。分部求和的证明此处省略。具体步骤如下:首先,定义前向差分用于分部求和(这类似于积分中的)。然后, 特别地,我们有

再次,证明 足够,而这同样成立的原因是:期望值 的存在。

备注.

  • 利用类似的证明,我们也可以证明(分部求和法)。
  • 因此,方差
Clipboard

练习。 使用“和式拆分”方法证明

解答

证明。


以下是 的递推关系,当我们想要找到 的完全/截短余命时,这些关系式很有用,前提是已知其他年龄(例如 )的余命。

我们将以命题的形式陈述这些递推关系,然后对其进行形式化证明。在证明之后,我们将尝试对 的递推关系给出一些直观的解释。

命题。 .

证明。 特别地,我们有 .

对这个递归关系的一个直观解释如下

  • 对于左侧, 的截尾期望寿命;

  • 对于右侧, 的剩余期望寿命,我们想要将其“转换”为 的期望寿命。第一步是加上 1,因为这是相对于 的期望寿命,但我们想要从 的角度来看待期望寿命,它比前者年轻 1 岁。但仅仅这一步还不够,因为“” 假设生命已经存活了 年,但对于 ,生命仅被假定存活了 年。因此,我们还需要乘以 存活一年的概率,,以“到达”
  • 现在,“从 岁开始的期望寿命” 是通过 来计算的。那么“从 岁到 岁的期望寿命” 呢?实际上,当生命在 岁和 岁之间死亡时,。这意味着这种“期望寿命”为零。

命题. .

证明.

示例。 已知 ,则有 。特别地, 时取非零值, 时取非零值。此外, 仅当 时成立。由此可知, 的界限由 给出。

Clipboard

练习。 已知

1 计算

0.5
0.75
1
1.25
1.5

2 计算

0.5
0.75
1
1.25
1.5



先前,我们已经讨论了连续随机变量和离散随机变量。生命表可以确定的分布,因为对于不同的整数的值可以从生命表中获得。然而,生命表不足以确定的分布,因为当不是整数时,我们不知道的值。因此,为了使用生命表指定的分布,我们需要对分段(非整数)年龄做出一些假设。

在精算科学中,三种假设被广泛使用,即死亡均匀分布(UDD)(或线性插值)、死亡力恒定(或指数插值)和双曲线(或Balducci)假设(或调和插值)。我们将使用生存函数来定义它们,如下所示

定义。 (死亡均匀分布)死亡均匀分布假设假设

定义。 (死亡力恒定)死亡力恒定假设假设

该方程也可以表示为

定义。 (Balducci假设)Balducci假设假设

备注.

  • 它也称为双曲线假设

Assumptions for fractional ages

备注.

在UDD假设下,我们对与死亡率相关的各种概率有一些“良好”且简单的表达式。我们可以通过用假设中提到的等式的右边替换来获得这些表达式。

示例. 在UDD假设下,当时,

Clipboard

练习. 证明在UDD假设下,当时,

答案

在UDD假设下,当 特别地,我们对而不是求导,因为只有是变化的,而应该固定在一个选定的整数上。此外,我们在前面的例子中使用了结果:作为最后一步。


对于前面提到的三种假设,每种假设都有一个特别“简洁”和简单的结果,在实践中,我们可以使用这些“简洁”的结果进行计算,而不是应用定义。UDD假设的“简洁”结果在前面的例子中提到:当。其他两种假设的“简洁”结果如下所示

定理。(常力假设下的显著性质)在常力假设下,

证明。

定理。 (巴尔杜奇假设下的显著性质) 在巴尔杜奇假设下,

证明。

在UDD假设下,一个有趣的结论与两个随机变量的独立性有关。

为了简化符号,从现在开始,我们令 ,除非另有说明。

定义一个连续随机变量 。也就是说, 是表示 死亡年份中度过的时间的 年分数 的随机变量。例如,如果 ,那么 在死亡年份中生存了半年。

然后, 在 UDD 假设下是独立的。这是因为在 UDD 假设下,。此外,我们可以观察到 的累积分布函数为 ,这是区间 上均匀分布的累积分布函数。这意味着在 UDD 假设下, 服从区间 上的均匀分布。因此,。这产生了在 UDD 假设下的结果。

  • .
  • .

这两个结果为我们提供了一种计算的均值和方差的替代方法,其中计算中仅使用了离散的内容。但是,我们需要注意的是,这些结果是在UDD假设下成立的,因此在没有UDD假设的情况下,我们不能使用这些结果。

Clipboard

练习。(之前练习回顾)在之前的练习中,我们被要求计算给定时的。以下问题是对此练习的一些进一步问题。

(a) 证明该生存函数满足UDD假设。

(b) 验证


解答
(a)

证明。因为当时,并且根据定义,该生存函数满足UDD假设。

(b) 从之前的练习中,我们有。因此,


死亡力模型

[编辑 | 编辑源代码]

在本节中,我们将介绍一些简单的死亡力模型(即死亡率的一些特定分布)。这些模型中的一些可能适用于模拟人类在某些年龄段的死亡率,但人们普遍认为,这些模型中没有一个适用于模拟人类在所有年龄段的死亡率。

事实上,如果我们想使用某种概率分布来模拟人类的死亡率,我们可能需要使用混合分布,因为人类在不同年龄段的死亡率分布方式不同,因此应该在不同的年龄段使用不同的分布。为了选择某些年龄段的合适分布,我们可以根据实际的人类死亡率数据研究相应经验分布的形状,并据此选择合适的分布。例如,如果死亡率在某些年龄段呈指数增长,那么我们可以选择一个死亡力也呈指数增长的分布。

在实践中,为了计算与人类死亡率相关的概率,我们通常使用生命表进行计算。保险公司通常都是这样做的。每个保险公司都有自己的生命表,该生命表基于其客户(可能是其客户)的死亡率数据。由于这种生命表是使用基于过去经验的实际人类死亡率数据构建的,因此生命表通常被认为比特定分布更准确。

然而,拥有一个死亡力模型可以简化与死亡率相关的概率的计算。

定义。(棣莫弗死亡力模型)棣莫弗死亡力模型的死亡力为,生存分布为,其中称为极限年龄,即人类必须在此年龄之前(严格意义上)死亡)。

备注.

  • 这是我们讨论的模型中最简单的模型。
  • 事实上,在这个模型中,死亡率遵循均匀分布,区间为,因为累积分布函数为,这与区间上均匀分布的累积分布函数完全相同。
  • 因此,概率密度函数为
Clipboard

练习。 验证如果死亡力为 (), 则生存分布 ().

解答

其中 时,我们有

示例。 证明在德·莫弗死亡率定律下, (其中 ), 并在 上设置一定的界限。

证明。 在德莫弗死亡率法则下,我们有 ,其中 有一定的范围。

Clipboard

练习。

1. 因此,证明在德莫弗死亡率法则下

解答

证明。 根据上述,我们有 ,在德莫弗死亡率法则下。由此可得


2. 上述示例中 的范围是什么?

解答

的范围由 给出,因为对于 ,范围是 。但由于 代表时间,所以 。因此, 的范围由 给出。

3. 考虑到上述示例, 服从什么分布?

解答

从上面的例子中,累积分布函数 。因此, 服从区间 上的均匀分布

备注.

  • 由此可见,当年龄 增加时,分布类型 不变(仍然是均匀分布),但支撑集的右端点减小。


4. 因此,证明

解答

证明。 由于 服从区间 上的均匀分布,因此,其均值



定义。 (Gompertz死亡力定律)Gompertz死亡力定律 的死亡力为 ,生存分布为 ,其中

定义。 (Makeham死亡力定律)Makeham死亡力定律 的死亡力为 ,生存分布为 ,其中

备注.

  • Makeham死亡力定律是Gompertz死亡力定律的推广,因为当 时,这两个定律完全相同。

定义.(威布尔死亡率定律)威布尔死亡率定律的力死亡率为,生存分布为,其中


选择与最终表

[编辑 | 编辑源代码]

当一个人购买保险公司提供的寿险保单时,他需要向保险公司提供一些个人信息,例如一些关于其健康状况的信息。为了决定是否应该向该人出售保单,保险公司会通过承保流程获取该人提供的信息。对于承保,承保人会检查信息以查看为该人投保的风险是否合适。

如果没有承保,人们很可能只会在他们认为自己很快就会去世时(例如,他们患有非常严重的疾病)才会购买寿险保单,这样他们很可能会提前提出索赔。在这种情况下,保险公司可能需要支付大量资金并在短时间内遭受巨大损失,然后破产。这说明了承保的必要性。

基本上,标题部分中的“选择”源于承保流程,当我们说一个人在岁时被“选择”时,他是在岁时进行了承保(因此,了解有关该个体的最新信息)。由于在该个人进行承保(或选择)时,有一些关于该个人的新信息,因此我们预计他的生存分布会有一些更新,因此他与死亡率相关的概率也会发生变化。因此,我们需要根据选择年龄在精算符号中进行一些更改。

在这种精算符号中,我们通常在选择年龄周围加上方括号,并且下标中的数字相应地发生变化。例如,如果选择年龄为 25,则变为;如果选择年龄为 12,则

由于当一个人很久以前就进行了承保时,从他进行承保到现在的这段时间里,他的健康状况可能会更差(例如,变老并患有一些新的疾病),因此我们直观地预计,从岁的人进行承保的时间过去的时间越长,该人在未来一年中死亡的可能性就越大。也就是说, [1]

选择年龄对生存分布的影响,随着从选择时间过去的时间推移可能会减弱。超过一定的时间段,比如年,在相同已生存年龄(即选择年龄加上从选择到现在过去的时间)但不同选择年龄下的将非常接近。换句话说,(对的条件是为了确保左侧的选择年龄[2]。这样的年被称为选择期。因为上述将非常接近,所有这些将只写成,不带任何方括号(因为选择的效应基本上“消失了”,所以方括号也消失了)。例如,如果选择期为2年,则都将简单地写成。但是,我们不会将写成,因为这两个由于选择的影响仍然“相当大”,所以是“相当不同的”。

以下是与生命表相关的一些术语。

  • 一个总生命表是一个生命表,其中函数仅针对已生存年龄给出。
  • 一个选择生命表是一个生命表,其中某些函数涉及选择年龄。
  • 一个最终生命表通常作为最后一列附加到选择生命表中,以反映选择生命表的设置。以这种方式组合选择生命表和最终生命表被称为选择与最终生命表

例如,选择与最终生命表(选择期为2年)的摘录可能如下所示

选择期为2年的选择与最终生命表
选择年龄,

0
1
2
... ... ... ...

最后一列是最终表格。我们可以观察到,对于等,我们不需要额外的列,因为我们已经可以在“”值的不同行(具有不同的)中获得这些值。

给定一个选择与最终表,我们可以基于它进行各种计算。

示例。 给定一个(假设的)选择与最终生命表的一部分,选择期为 4 年: 然后,,以及 [3](因为选择期为 4 年)。

Clipboard

练习。

以下哪个(或哪些)概率**无法**从上述选择与最终生命表中计算得出?




  1. 方括号内的数字是整数,因为它表示年龄。

  2. (可选) 更准确地说,选择期是最小的整数,使得 ( 是一个小的正常数。当它越小时,要求越“严格”,而的值将“更接近”。) 对于每个
  3. 的值取自,其中
华夏公益教科书