专家系统/Dempster-Shafer 理论
Dempster-Shafer 理论是一个基于置信函数和似然推理的数学证据理论[1],用于结合不同的信息片段(证据)来计算事件的概率。该理论由 Arthur P. Dempster 和 Glenn Shafer 创立。
第一个赌注是,我们赌一个公平的硬币抛出后正面朝上。现在考虑第二个赌注,我们赌世界上最伟大的拳击手和世界上最伟大的摔跤手之间的比赛结果。假设我们对格斗术非常无知,很难做出选择。
许多人会觉得第二个赌注比第一个赌注更难以确定,因为第二个赌注的概率是未知的,而第一个赌注的概率很容易看出是二分之一。 Dempster-Shafer 理论允许人们考虑对分配给各种结果的概率的置信度。
令X为全集:所有正在考虑的状态的集合。幂集,,是所有可能的X子集的集合,包括空集。例如,如果
那么
幂集的元素可以用来代表人们可能感兴趣的命题,因为它们包含并且仅包含该命题为真的所有状态。
证据理论将置信度分配给幂集的每个子集。正式地,一个函数 ,称为基本置信度分配(BBA),当它验证两个公理时。首先,空集的质量为零
其次,幂集其余成员的质量总和为 1
幂集的给定成员A的质量m(A) 表示所有相关和可用证据中支持实际状态属于A但属于A的任何特定子集的比例。m(A) 的值仅与集合A相关,并且不做出关于A的任何子集的额外声明,根据定义,每个子集都有它自己的质量。
从质量分配中,可以定义概率区间的上限和下限。该区间包含感兴趣的集合的精确概率(以经典意义),并受称为置信度(或支持)和似然度的两个非加性连续测度限制
集合 *A* 的置信度 bel(*A*) 被定义为所有(不一定是真)子集的质量之和,这些子集属于我们感兴趣的集合。
似然度 pl(*A*) 是所有与我们感兴趣的集合 *A* 相交的集合 *B* 的质量之和。
这两个度量之间的关系如下
从上面可以看出,你只需要知道三个中的一个(质量、置信度或似然度)就可以推断出另外两个,尽管你可能需要知道许多集合的值才能计算出特定集合的另一个值。
Dempster 组合规则
[edit | edit source]我们现在面临的问题是如何组合两组独立的质量分配。最初的组合规则被称为 Dempster 组合规则,它是贝叶斯规则的推广。该规则强烈强调多个来源之间的一致性,并通过归一化因子忽略了所有冲突证据。当遇到信息中的显著冲突时,使用该规则受到了严重批评。
具体来说,组合(称为联合质量)是从两组质量 和 中计算出来的,如下所示
其中
是衡量两组质量之间冲突程度的指标。归一化因子 的作用是完全忽略冲突,并将与冲突相关的任何质量归于空集。因此,在某些情况下,当遇到重大的冲突时,此操作会产生违反直觉的结果。
讨论
[edit | edit source]Dempster-Shafer 理论是贝叶斯主观概率理论的推广;贝叶斯理论要求对每个感兴趣的问题提供概率,而置信函数则将对一个问题的置信度(或信心、信任)建立在对相关问题的概率基础上。这些置信度可能具有也可能不具有概率的数学性质;它们之间的差异程度取决于两个问题之间相关性的紧密程度。[2] 换句话说,它是一种表达认知可能性(epistemic plausibilities)的方式,但它可以得出与使用概率论得出的答案相矛盾的结果。
Dempster-Shafer 理论通常用作传感器融合的方法,它基于两个思想:从相关问题的主观概率中获取对一个问题的置信度,以及 Dempster 规则[3] 用于结合这些基于独立证据的置信度。本质上,对一个命题的置信度主要取决于包含该命题的答案数量(针对相关问题),以及每个答案的主观概率。另外,组合规则也做出了贡献,它们反映了关于数据的普遍假设。
在这个形式体系中,置信度(也称为质量)用置信函数来表示,而不是贝叶斯概率分布。概率值分配给可能性集合,而不是单个事件:它们的吸引力在于,它们自然地编码了支持命题的证据。
Dempster-Shafer 理论将其质量分配给构成系统的所有实体的子集。例如,假设一个系统有五个成员,也就是说五个独立状态,其中只有一个是实际的。如果原始集合称为 S,,那么所有子集的集合——幂集——称为 2S。由于你可以用二进制向量表示每个可能的子集(通过写“1”或“0”来描述某个成员是否存在,从而描述该成员槽位的出现或不存在),因此可以看出,有 25 个可能的子集 ( 一般来说),从空集 (0, 0, 0, 0, 0) 到“所有”集合 (1, 1, 1, 1, 1)。空集代表矛盾,它在任何状态下都不成立,因此被分配为零质量;其余的质量被归一化,使它们的总和为 1。“所有”集合通常被标记为“未知”,因为它代表所有元素都存在的状态,从某种意义上说,你无法确定哪个是实际的。
置信度和可能性
[edit | edit source]Shafer 的框架允许将关于命题的置信度表示为区间,由两个值置信度(或支持)和可能性限定
- 置信度 ≤ 可能性。
对一个假设的置信度由包含在该假设内的所有集合的质量之和构成(即,所有假设子集的质量之和)。它是直接支持给定假设的置信度,至少部分支持,形成一个下限。可能性是 1 减去与假设的交集为空的所有集合的质量之和(等效地,它是所有与假设的交集不为空的集合的质量之和)。它是假设可能发生的可能性上限,即它“可能发生的”上限为该值,因为只有那么多的证据与该假设相矛盾。
例如,假设我们对一个命题的置信度为 0.5,可能性为 0.8,比如“箱子里的猫死了”。这意味着我们有证据可以让我们强烈地说,该命题为真的置信度为 0.5。但是,与该假设相反的证据(即“猫还活着”)只有 0.2 的置信度。剩余的 0.3 质量(0.5 的支持证据与 0.2 的相反证据之间的差距)是“不确定的”,这意味着猫可能死了也可能活着。这个区间代表了系统中证据所体现的不确定性水平。
假设 | 质量 | 置信度 | 可能性 |
---|---|---|---|
空(既不活着也不死了) | 0 | 0 | 0 |
活着 | 0.2 | 0.2 | 0.5 |
死了 | 0.5 | 0.5 | 0.8 |
任一(活着或死了) | 0.3 | 1.0 | 1.0 |
空假设根据定义设置为零(它对应于“无解”)。正交假设“活着”和“死了”的概率分别为 0.2 和 0.5。这可能对应于“活猫/死猫探测器”信号,它们各自的可靠性分别为 0.2 和 0.5。最后,包含所有假设的“任一”假设(它只是承认箱子里有猫)弥补了差距,使得质量之和为 1。“活着”和“死了”假设的支持与其相应的质量匹配,因为它们没有子集;对“任一”的支持由所有三个质量之和(任一、活着和死了)组成,因为“活着”和“死了”都是“任一”的子集。“活着”的可能性是 m(活着) + m(任一),因为只有“任一”与“活着”相交。同样地,“死了”的可能性是 m(死了) + m(任一)。最后,“任一”的可能性是 m(活着) + m(死了) + m(任一)。通用假设(“任一”)将始终具有 100% 的支持和可能性——它充当一种校验和。
这里是一个稍微复杂的例子,其中支持和可能性之间的行为开始显现出来。我们正在观察一个遥远的目标,它只能通过各种探测模式以三种颜色(红色、白色和蓝色)中的任何一种呈现出来
假设 | 质量 | 置信度 | 可能性 |
---|---|---|---|
空 | 0 | 0 | 0 |
红色 | 0.35 | 0.35 | 0.56 |
白色 | 0.25 | 0.25 | 0.45 |
蓝色 | 0.15 | 0.15 | 0.34 |
红色或白色 | 0.06 | 0.66 | 0.85 |
红色或蓝色 | 0.05 | 0.55 | 0.75 |
白色或蓝色 | 0.04 | 0.44 | 0.65 |
任一 | 0.1 | 1.0 | 1.0 |
尽管这些例子相当糟糕,因为这种类型的事件不会在概率空间中建模为不相交的集合,而是会将“红色或蓝色”事件视为“红色”和“蓝色”事件的并集,从而(参见概率论的公理)p(红色或白色) >= p(白色) = 0.25 且 p(任一) = 1。实际上,人们可以对线性与“可能性”成比例的空间建模概率测度(归一化使得 p(红色) + p(白色) + p(蓝色) = 1,并且除了所有概率仍 <= 1 之外)。
组合概率集
[edit | edit source]使用Dempster 组合规则来组合对应于独立信息的置信度,它是事件独立时贝叶斯定理特例的推广(目前还没有方法来组合非独立的信息)。请注意,来自相互矛盾命题的概率质量也可以用来获得系统中冲突程度的度量。该度量已被用作将多个看似相互冲突的证据围绕竞争假设进行聚类的标准。
此外,Dempster-Shafer 框架的一个计算优势是,不需要指定先验和条件概率,这与贝叶斯方法不同,贝叶斯方法通常使用对称(极小极大误差)论证来为随机变量分配先验概率(例如,为二进制值分配 0.5,对于这些值,没有关于哪个更可能的信息)。但是,Dempster-Shafer 框架中没有使用任何包含在缺少的先验和条件概率中的信息,除非它可以通过间接方式获得——并且可以说,它然后可以使用贝叶斯方程进行计算。
在这种情况下,Dempster-Shafer 理论允许指定一定程度的无知,而不是被迫提供加起来为一的先验概率。这种类型的状况,以及是否存在风险和无知之间的真正区别,已被统计学家和经济学家广泛讨论。例如,参见 Daniel Ellsberg、Howard Raiffa、Kenneth Arrow 和 Frank Knight 的对比观点。
批评
[edit | edit source]Judea Pearl (1988a, 第 9 章;[4] 1988b[5] 和 1990);[6] 认为,将置信函数解释为代表“事件的概率”、“对分配给各种结果的概率的信心”、“对命题的置信度(或信心、信任)”或“情况下的无知程度”是误导的。相反,置信函数代表了从分配了概率的一组其他命题中证明给定命题的概率。混淆真实性的概率与可证性的概率会导致推理任务中的反直觉结果,例如(1)表示完整知识,(2)置信度更新和(3)证据合并。他进一步证明,如果部分知识通过置信函数方法进行编码和更新,则结果置信度不能作为理性决策的基础。
参考文献
[edit | edit source]- ↑ Shafer, Glenn; A Mathematical Theory of Evidence, 普林斯顿大学出版社,1976 年
- ↑ Shafer, Glenn; Dempster-Shafer theory,2002 年
- ↑ Dempster,Arthur P.; *贝叶斯推理的推广*,皇家统计学会杂志,B系列,第30卷,第205-247页,1968年
- ↑ Pearl,J. (1988a),*智能系统中的概率推理*,(修订第二版印刷)加利福尼亚州圣马特奥:摩根考夫曼。
- ↑ Pearl,J. (1988b)“论概率区间”,*近似推理国际杂志*,2(3):211-216。
- ↑ Pearl,J. (1990) 用置信函数推理:对兼容性的分析。*近似推理国际杂志*,4(5/6):363-389。
- Joseph C. Giarratano 和 Gary D. Riley (2005);*专家系统:原理和编程*,ed. Thomson Course Tech.,ISBN 0-534-38447-1
- Kari Sentz 和 Scott Ferson (2002);*德姆斯特-谢弗理论中的证据组合*,桑迪亚国家实验室 SAND 2002-0835