交通经济学/博弈
首先,让我们玩奇偶游戏。
这是一个经典的游戏,用来决定平局的决胜局或解决比赛。它只需要你的手指。
- 无限重复的循环赛(例如,使用以下链接中的时间表进行循环赛,然后再次进行,然后再次进行,依此类推,直到教授在某个不可预测的次数后说停止)。
- 收益矩阵(见下文),收益形式为 [A, B],因此第一个数字是玩家 A 的收益,第二个数字是玩家 B 的收益。玩家 A 是循环赛时间表中的第一个玩家。
- 这个游戏 奇偶游戏
- 策略(写下来,暂时保密)
- 记分(记录你的分数……荣誉制度)
- 奖品:同伴的敬畏
使用 循环赛时间表 来确定锦标赛的时间表。
玩家 B | |||
奇数 | 偶数 | ||
玩家 A | 奇数 | [3, 3] | [0, 5] |
偶数 | [5, 0] | [1, 1] |
这一切意味着什么?
系统理性与用户理性
以牙还牙与短视的自私
见 阿纳托尔·拉波波特,他为类似的基于计算机的策略开发了成功的以牙还牙策略。
博弈论关注经济主体的战略互动的一般分析,他们的决策会相互影响。
可以用博弈论分析的问题
- 拥堵
- 融资
- 合并
- 公交车与汽车
- ……
每个游戏中的主体是谁?
在博弈论中,支配(也称为战略支配)是指当一个玩家的策略优于另一个策略时,无论该玩家的对手如何行动,都会出现这种情况。许多简单的游戏可以使用支配来解决。相反,非传递性发生在游戏中的一个策略可能比另一个策略更好或更糟,这取决于玩家的对手如何行动。(参考:支配策略)
纳什均衡(NE):当 A 的选择在 B 的选择下是最佳选择,而 B 的选择在 A 的选择下是最佳选择时,一对策略被定义为 NE。NE 可以被解释为对每个人选择的预期,使得一旦一个人做出自己的选择,两个人都不想改变自己的行为。
如果在一个游戏中,一个玩家存在严格的支配策略,那么该玩家将在游戏的每个纳什均衡中使用该策略。如果两个玩家都有严格的支配策略,那么该游戏只有一个唯一的纳什均衡。但是,该纳什均衡并不一定是帕累托最优的,这意味着游戏可能存在非均衡结果,这对两个玩家都更好。用来说明这一点的经典游戏是囚徒困境。(参考:支配策略)
玩家 B | |||
i | j | ||
玩家 A | i | [3,3]* | [2,2] |
j | [2,2] | [1,1] |
玩家 A 的收益以单元格中的第一个数字表示,玩家 B 的收益以该单元格中的第二个数字表示。因此策略对 [i,i] 意味着玩家 A 的收益为 3,玩家 B 的收益也为 3。NE 在上面的插图中用星号标出。这代表了一种情况,在这种情况下,每家公司或每个人都在做出最优选择,前提是另一家公司或另一个人的选择。在这里,A 和 B 都明显更喜欢选择 i 而不是选择 j。因此 [i,i] 是一个 NE。
之前,我们玩了一个有限的一次性游戏和一个无限重复的游戏。这个游戏被设定为所谓的“囚徒困境”。
囚徒困境这个词源于这样一种情况:两个犯罪同伙都被逮捕并分别接受调查。如果他们都“坚持到底”,由于缺乏证据,他们会得到较轻的刑罚(比如各判处 1 年)。如果他们在审讯中都崩溃并认罪,他们将共同承担犯罪的刑期(比如各判处 10 年)。但如果一个人认罪而另一个人不认罪,认罪者会成为污点证人(并获得假释),并帮助定罪另一个人(后者会在监狱里服刑 20 年)
在一次性或有限重复的囚徒困境游戏中,认罪(收费、背叛、偶数)是一种支配策略,当两个囚徒都认罪(州收费、背叛、偶数)时,这是一种支配策略均衡。
(基于 Levinson,David (1999) 边境收费:博弈论分析。第十四届交通与交通理论国际研讨会论文集 173-187。)
两个州(特拉华州和新泽西州)被一片水域隔开。它们由一座跨越该水域的桥梁连接。他们应该如何为这座桥梁以及他们其余的道路提供资金?
他们应该收费还是征税?
设 和 是两个司法管辖区的收费。需求是一个负指数函数。(目标是最大化地方福利(居民的效用加上非居民的收费收入(居民的收费收入被视为转移支付)。)
司法管辖区 J(新泽西州) | |||
i | j | ||
司法管辖区 I(特拉华州) | i | [1153, 1153]* | [2322,883] |
j | [883, 2322] | [1777,1777] |
表格的解读方式如下:每个司法管辖区选择两种策略中的一种(收费或征税)。实际上,司法管辖区 1(特拉华州)选择一行,而司法管辖区 2(新泽西州)选择一列。每个单元格中的两个数字表明了当选择相应的策略对时,两个州的结果。逗号左边的数字表明选择行(特拉华州)的司法管辖区的收益,而逗号右边的数字表明选择列(新泽西州)的州的收益。因此(沿着第一列向下看)如果他们都收费,那么每个州都获得 1153 美元/小时的福利,但如果新泽西州收费而特拉华州征税,那么新泽西州获得 2322 美元,而特拉华州只获得 883 美元。
所以:如何解决这个游戏?如果两个州都希望最大化福利,什么策略是“理性的”?新泽西州可能会这样推理:“会发生两种情况:特拉华州可以收费或特拉华州可以继续征税。假设特拉华州收费。那么如果我不收费,我就只能得到 883 美元,如果我收费,我就得到 1153 美元,所以在这种情况下,收费是最好的。另一方面,如果特拉华州征税而我收费,我就得到 2322 美元,如果我征税,我们都得到 1777 美元。无论哪种方式,我收费都是最好的。因此,我将收费。”
但特拉华州的推理方式类似。因此,他们都收费,并损失了 624 美元/小时。然而,如果他们采取了“非理性”的行为并征税,他们每个州都可以获得 1777 美元/小时。
在英国、日本、澳大利亚和其他一些岛国,人们在道路的左侧行驶;在美国和欧洲大陆,人们在右侧行驶。但是,无论在哪里,每个人都与其他地方的人一样,在同一侧行驶,即使该侧在不同的地方会有所不同。
这种安排是如何实现的?
有两种策略:靠左行驶和靠右行驶。有两种可能的结果:两辆车顺利驶过彼此,或者相撞。我们任意将顺利通过的值分配为 1,将相撞的值分配为 -10。以下是收益表
奔驰 | |||
左侧 | 右侧 | ||
别克 | 左侧 | [1,1] | [-10,-10] |
右侧 | [-10,-10] | [1,1] |
(目标:最大化收益)
验证 LL 和 RR 都是纳什均衡。
但是,如果我们不知道选择哪一边,我们可能会随机选择 LR 或 RL 并发生碰撞,存在一些风险。我们如何知道选择哪一边?答案是,当然,对于这个协调博弈,我们依靠社会惯例。相反,我们知道,在这个博弈中,社会惯例非常强大且持久,在解决方案为 LL 的国家也不逊于解决方案为 RR 的国家。
参见 左侧或右侧驾驶的歷史討論
- 什么是“理性”?
- 当理性策略取决于他人的策略时会发生什么?
- 如果信息不完整会发生什么?
- 如果存在不确定性或风险会发生什么?
- 在什么情况下合作比自私更好?在什么情况下合作是自私的?
- 持续的互动与一次性事件有何不同?
- 道德可以从理性的自私中推导出吗?
- 现实与博弈论有何比较?
无限或无限重复的囚徒困境博弈与有限重复或一次性博弈有何不同?为什么?
两家航空公司(美联航,美国航空)分别提供从纽约到洛杉矶的 1 个航班。
价格 = $/pax,收益 = $/航班。
每架飞机载客 500 人。
固定成本为每航班 50000 美元,总需求为 200 美元时为 500 名乘客。
在 400 美元时,总需求为 250 名乘客。
乘客选择最便宜的航班。
收益 = 收入 - 成本
两人合作(4 分钟)
1. 为博弈制定收益矩阵。
2. 什么是均衡?
零和博弈:如果我们将博弈中的胜负相加,将损失视为负数,发现对于选择的每组策略,总和为零,那么该博弈就是“零和博弈”。
3. 如果存在第三个价格 300 美元,其需求为 375 名乘客,会发生什么?
重新表述问题。
混合策略:如果博弈中的玩家以特定概率随机选择两种或多种策略,则这种选择被称为“混合策略”。
- Levinson, David (2005) 拥堵和定价的微观基础:博弈论视角。交通研究 A 部分 第 39 卷,第 7-9 期,2005 年 8 月 - 11 月,第 691-704 页。
- Levinson, David (2000) 串联网络上的收入选择。交通经济与政策杂志 34,1: 69-98。