交通经济学/博弈
首先,让我们玩奇偶游戏。
这是一款经典的游戏,用于确定决胜局或解决比赛。它只需要你的手指。
- 无限重复的循环赛(即使用下面链接中的时间表进行循环赛,然后重复进行,直到教授在某个不可预测的次数之后说停)。
- 收益矩阵(见下文),收益形式为 [A, B],因此第一个数字是玩家 A 的收益,第二个数字是玩家 B 的收益。玩家 A 是循环赛时间表中的第一个玩家。
- 游戏 奇偶游戏
- 策略(写下来,现在暂时保密)
- 记分(记录你的分数……荣誉系统)
- 奖品:你同行的敬畏
使用 循环赛时间表 来确定比赛的时间表。
玩家 B | |||
奇数 | 偶数 | ||
玩家 A | 奇数 | [3, 3] | [0, 5] |
偶数 | [5, 0] | [1, 1] |
这一切意味着什么?
系统理性与用户理性
以牙还牙与短视的自私
参见 阿纳托尔·拉波波特,他为类似的基于计算机的策略开发了成功的以牙还牙策略。
博弈论关注的是对经济主体战略性互动的一般分析,其决策会相互影响。
可以用博弈论分析的问题
- 拥堵
- 融资
- 合并
- 公交车与汽车
- …
每个游戏中的主体是谁?
在博弈论中,*支配*(也称为战略支配)发生在当一种策略对于某个玩家而言比另一种策略更好时,无论该玩家的对手如何行动。许多简单的博弈可以使用支配来解决。相反,非传递性发生在当一种策略对于某个玩家而言可能比另一种策略更好或更差时,具体取决于该玩家的对手如何行动。(参考:占优策略)
*纳什均衡*(NE):如果 A 的选择在给定 B 的情况下是最佳的,而 B 的选择在给定 A 的情况下是最佳的,则一对策略被定义为 NE。NE 可以解释为对每个人选择的期望,这样一来,一旦一个人做出自己的选择,任何个人都不想改变自己的行为。
如果一个博弈中对于一个玩家存在严格占优策略,那么该玩家将在博弈的每个纳什均衡中采用该策略。如果两个玩家都有严格占优策略,那么该博弈只有一个唯一的纳什均衡。但是,该纳什均衡并不一定是帕累托最优的,这意味着博弈中可能存在非均衡结果,这些结果对两个玩家都更好。用于说明这一点的经典博弈是囚徒困境。(参考:占优策略)
玩家 B | |||
i | j | ||
玩家 A | i | [3,3]* | [2,2] |
j | [2,2] | [1,1] |
玩家 A 的收益用每个单元格中的第一个数字表示,玩家 B 的收益用该单元格中的第二个数字表示。因此策略对 [i,i] 意味着玩家 A 的收益为 3,玩家 B 的收益也为 3。NE 在上面的图示中用星号表示。这表示一种情况,在这种情况下,每个公司或个人都在给定其他公司或个人选择的条件下做出了最佳选择。在这里,A 和 B 都明显更喜欢选择 i 而不是选择 j。因此 [i,i] 是一个 NE。
之前,我们玩过有限的一轮游戏和无限重复的游戏。这场游戏被描述为“囚徒困境”。
“囚徒困境”这个词语源于这样一种情况:两个犯罪合伙人被捕,分别接受调查。如果他们都“坚持到底”,他们因为缺乏证据而获得轻判(比如各判 1 年)。如果他们都在审讯中崩溃并认罪,他们将均分犯罪时间(比如 10 年)。但如果一个人认罪,而另一个人不认罪,认罪的人成为污点证人(获得假释)并帮助定罪另一个(在监狱里服刑 20 年)。
在一次性或有限重复的囚徒困境博弈中,认罪(收费、背叛、偶数)是占优策略,当两个囚徒都认罪(收费、背叛、偶数)时,那就是占优策略均衡。
(基于 Levinson, David (1999) 边境收费:博弈论分析. 第十四届国际交通运输与交通理论研讨会论文集 173-187.)
两个州(特拉华州和新泽西州)被一片水域隔开。它们通过一座跨越该水域的桥梁连接起来。他们应该如何为这座桥梁和他们的其他道路提供资金?
他们应该收费还是征税?
令 和 是这两个管辖区的收费。需求是负指数函数。(目标是最大化当地福利(居民的效用加上非居民的收费收入(居民的收费收入被视为转移支付)。)
管辖区 J(新泽西州) | |||
i | j | ||
管辖区 I(特拉华州) | i | [1153, 1153]* | [2322,883] |
j | [883, 2322] | [1777,1777] |
该表格的阅读方式如下:每个管辖区选择两种策略之一(收费或征税)。实际上,管辖区 1(特拉华州)选择一行,管辖区 2(新泽西州)选择一列。每个单元格中的两个数字表示当选择相应的策略对时,两个州的结果。逗号左侧的数字表示选择行(特拉华州)的管辖区的收益,而逗号右侧的数字表示选择列(新泽西州)的州的收益。因此(向下阅读第一列)如果他们都收费,每个人获得 $1153/小时的福利,但如果新泽西州收费而特拉华州征税,新泽西州获得 $2322 而特拉华州只获得 $883。
因此:如何解决这场博弈?如果两个州都希望最大化福利,哪些策略是“理性的”?新泽西州可能会这样推理:“两种情况可能发生:特拉华州可以收费或特拉华州可以继续征税。假设特拉华州收费。那么如果我不收费,我只能获得 $883,如果我收费,我获得 $1153,因此在这种情况下,收费是最好的。另一方面,如果特拉华州征税而我收费,我获得 $2322,如果我征税,我们都获得 $1777。无论哪种情况,收费对我来说都是最好的。因此,我会收费。”
但特拉华州的推理方式类似。因此,他们都收费,损失了 $624/小时。然而,如果他们“非理性”地采取行动,征税,他们每个人可以获得 $1777/小时。
在英国、日本、澳大利亚和一些其他岛国,人们在道路的左侧行驶;在美国和欧洲大陆,他们在右侧行驶。但在任何地方,每个人都在与其他地方相同的一侧行驶,即使该侧在不同的地方发生变化。
这种安排是如何实现的?
有两种策略:左侧行驶和右侧行驶。有两种可能的结果:两辆车顺利通过彼此或发生碰撞。我们任意将通过没有问题的值分配为 1,将碰撞的值分配为 -10。这是收益表
奔驰 | |||
左 | 右 | ||
别克 | 左 | [1,1] | [-10,-10] |
右 | [-10,-10] | [1,1] |
(目标:最大化收益)
验证 LL 和 RR 都是纳什均衡。
但是,如果我们不知道选择哪一边,我们就有可能会随机选择 LR 或 RL 并发生碰撞。我们怎么知道该选择哪一边呢?答案是,对于这个协调博弈,我们依赖于社会习俗。相反,我们知道在这个博弈中,社会习俗非常强大且持久,在解决方案是 LL 的国家中并不比在解决方案是 RR 的国家中少。
参见 左侧或右侧行驶的历史讨论
- 什么是“理性”?
- 当理性策略依赖于他人的策略时会发生什么?
- 如果信息不完整会发生什么?
- 如果存在不确定性或风险会发生什么?
- 在什么情况下合作比自私更好?在什么情况下合作是自私的?
- 持续互动与一次性事件有何不同?
- 道德可以从理性的自私中推导出来吗?
- 现实与博弈论相比如何?
无限次或无限次重复的囚徒困境博弈与有限次重复或一次性博弈有何不同?为什么?
两家航空公司(美联航、美国航空)每家都提供从纽约到洛杉矶的 1 个航班。
价格 = 美元/人,收益 = 美元/航班。
每架飞机载客 500 人。
固定成本为每航班 50000 美元,总需求为 200 美元,500 名乘客。
400 美元时,总需求为 250 名乘客。
乘客选择最便宜的航班。
收益 = 收入 - 成本
结伴工作(4 分钟)
1. 制定博弈的收益矩阵。
2. 什么是均衡?
零和博弈:如果我们把博弈中的胜负加起来,将损失视为负数,发现对于选择的每一组策略,总和都是零,那么这个博弈就是“零和博弈”。
3. 如果存在第三个价格 300 美元,需求为 375 名乘客,会发生什么?
重新制定问题。
混合策略:如果博弈中的一个玩家根据特定概率随机选择两种或多种策略,则此选择称为“混合策略”。
- Levinson,David(2005 年)拥堵和定价的微观基础:博弈论视角。运输研究 A 部分,第 39 卷,第 7-9 期,2005 年 8 月至 11 月,第 691-704 页。
- Levinson,David(2000 年)串行网络上的收益选择。运输经济与政策杂志,第 34 卷,第 1 期:69-98。