跳转到内容

博弈论入门/百万富翁的抉择

来自维基教科书,开放的书籍,为开放的世界

本文主要探讨了在热门电视游戏节目《百万富翁的抉择》中玩游戏的博弈论和最佳策略

一种基本策略是让参赛者以最大限度地提高奖金的预期价值的方式行动。在游戏中的每一个银行家提出报价的时刻,参赛者可以通过选择大于未打开箱子平均价值的报价来最大限度地提高预期价值,而在报价小于平均价值时拒绝报价。然而,银行家的报价几乎从未超过未打开箱子的平均价值。因此,如果参赛者总是选择这种策略,游戏就会变得无聊,因为游戏将包括参赛者始终拒绝报价,并继续打开箱子直到结束(或直到银行家的报价超过预期价值)。

然而,当其他策略涉及优化除预期价值之外的参数时,游戏就变得有趣了。拒绝银行家报价的参赛者是在接受一种风险,即他可能获得的奖金少于该报价。不同的人对风险的容忍程度不同。例如,如果在获得 400,000 美元与获得 1 美元或 1,000,000 美元的同等机会之间做出选择,许多参赛者会选择接受 400,000 美元,尽管事实上,如果参赛者的策略只是最大限度地提高预期价值,他们应该拒绝报价。许多参赛者会接受 400,000 美元的原因是,人们会最大限度地提高他们对金钱的效用,而不是直接最大限度地提高预期价值。随着一个人获得的钱越来越多,金钱的效用就会递减,例如,参赛者获得的第一个 400,000 美元的效用可能比接下来获得的 600,000 美元更有价值。

游戏看似简单的格式吸引了数学家、统计学家和经济学家的注意,作为对风险条件下决策的学习:它是一个关于效用理论应用的极好说明性例子。2004 年,一群经济学家玩了一个缩小版的游戏,有 84 名参与者,并将结果与预期效用假设进行了比较。[1] 该研究受到了媒体的广泛关注,2006 年 1 月 12 日刊登在《华尔街日报》的头版,并在 2006 年 3 月 3 日在美国国家公共广播电台播出。

策略建模

[edit | edit source]

在美国版《百万富翁的抉择》标准游戏的开始,游戏的预期价值为 131,477.54 美元,即 26 个箱子的平均值。但是,只有 26 个箱子中的 6 个箱子的价值大于预期价值,26 个箱子的中位数价值只有 875 美元。在提出任何交易之前,参赛者必须选择 6 个箱子淘汰。因此,在第一次报价时,箱子的预期价值可能在 13,420.80 美元到 170,916.25 美元之间,中位数价值可能在 350 美元到 17,500 美元之间,这导致了游戏参与者必须在游戏开始时做出决定的游戏条件的很大差异。

银行家的视角

[edit | edit source]

我们不应该只考虑赢得奖金的参赛者的视角,因为这是一场双人游戏,银行家是另一个玩家。由于银行家玩了大量的游戏,这大大降低了他的风险,因此他可以对剩余的风险极其容忍,并采用一种试图最大限度地降低参赛者赢得奖金的预期价值的策略。然而,他试图最大限度地降低的预期价值不是按场次计算的,而是按游戏时间计算的。对参赛者来说,能够让一名普通参赛者玩一个小时并赢得 100,000 美元的策略,对银行家来说比让一名普通参赛者只玩 15 分钟并赢得 50,000 美元的策略更有利。这有助于解释为什么银行家最初的几个报价仅仅是剩余箱子的预期价值的一小部分。一个最佳的银行家只会提出在他看来能够提高每小时游戏预期价值的报价。从参赛者的角度来看,这变成了他们必须支付的能够提前结束游戏的溢价。

参赛者的视角

[edit | edit source]

通常,参赛者会带着他们认为的最低满意奖金的想法进入游戏。只要参赛者能够在没有显著风险淘汰所有高于该最低奖金的奖金的情况下继续游戏,他就会这样做。参赛者认为满意的程度可能会在游戏过程中发生变化,因为剩下的奖金会发生变化。例如,当剩下的第二个最值奖金为 75,000 美元时,如果当前剩下的最值奖金为 100,000 美元,参赛者会对它可能成为剩下的最值奖金的风险感到更满意,而不是如果它为 1,000,000 美元。因此,玩家在风险较低的情况下可能希望继续玩游戏。到第四次报价时,还剩下八个箱子。在游戏中的这个阶段,参赛者淘汰所有价值 100,000 美元或以上的奖金的概率只有 4.8%,而剩下至少两个此类奖金的概率为 72.8%。因此,参赛者也不太可能接受早期的报价。

游戏的开始

在游戏的开始,参赛者可以选择一个箱子。实际选中 1,000,000 美元箱子的概率为 3.85%。有趣的是,许多参赛者实际上认为他们选择了 1,000,000 美元的箱子,即使没有选择百万美元箱子的概率为 96.15%。许多参赛者在做出决策时基于他们认为自己选择了百万美元的箱子(或其他五个更高价值的箱子中的一个)。随着游戏的进行,这通常会导致参赛者承担不必要的风险,并且不接受银行家的报价,即使该报价可能高于剩余箱子的平均价值的预期结果。这种人类行为现象(即妄想)几乎每次都会对参赛者不利。

游戏结束

[edit | edit source]

随着游戏中对参赛者来说满意的奖金数量减少,游戏继续进行的愿望对两个玩家来说都减少了。随着参赛者认为满意的奖金数量减少,参赛者的风险也增加了。这种增加的风险降低了报价要对参赛者具有吸引力所需的剩余箱子估计价值的百分比。相反,银行家,因为他也在努力优化游戏的娱乐价值,如果剩余箱子的价值都很低,他可能需要迅速结束游戏。为了结束游戏,他需要提高他为交易提供的剩余箱子估计价值的百分比,偶尔甚至超过估计价值。

与蒙提霍尔问题对比

[edit | edit source]

当只剩下三个箱子时,百万富翁的抉择似乎就像一个蒙提霍尔问题的版本。考虑一个有三个箱子的百万富翁的抉择游戏(类似于蒙提霍尔问题中的三个门)。参赛者有一个箱子。然后,另外两个箱子中的一个被打开。最后,参赛者被赋予了用自己的箱子交换剩余的未打开箱子的选择。

蒙提霍尔问题给参赛者提供了一个2/3的几率,可以通过切换赢得比赛,以及一个1/3的几率,可以通过保留他或她的箱子赢得比赛。然而,在让我们做一笔交易交易或不交易之间存在着至关重要的区别。在蒙提霍尔问题中,主持人利用了他对三个门后面隐藏的秘密知识,导致了一个错误的选择总是会被揭示出来。这种非随机的选择导致了错误的选择,这就是在让我们做一笔交易中切换和不切换的获胜几率不同的原因。这使得交易或不交易的行为类似于无知的蒙提霍尔问题。

分析风险下的决策

[编辑 | 编辑源代码]

一个经济学家团队——Post, Van den Assem, Baltussen & Thaler (报告)——分析了出现在交易或不交易中的人们的决策,发现,除其他事项外,当参赛者看到他们的预期收益下降时,他们的风险厌恶程度会降低。"输家"往往会继续玩游戏,即使这意味着拒绝超过剩余奖品平均值的银行报价。一项独立的实验研究 (报告),让学生参与者玩奖品缩小的游戏,也揭示了类似的模式。这些发现为行为经济学家提供了支持,行为经济学家声称,经典的预期效用理论由于没有考虑决策的背景,在解释人类行为方面存在不足。四位经济学家的研究是独一无二的,因为其基础的"实验"——交易或不交易的特点是高赌注、透明的概率分布,以及只需要最小的技巧或策略的简单停止/继续决策。

这项特殊的研究在美国吸引了一些媒体的关注,包括2006年1月12日的华尔街日报头版和2006年3月3日的美国国家公共广播电台的报道。

参考文献

[编辑 | 编辑源代码]
  1. Post, Van den Assem, Baltussen, 和 Thaler (2004年12月). "交易或不交易?风险决策在一个高额奖金的真人秀节目中". {{cite journal}}: Cite journal 需要 |journal= (帮助)CS1 maint: 多个名称:作者列表 (链接)
[编辑 | 编辑源代码]
华夏公益教科书