交通经济学/博弈

一个游戏

首先，让我们玩奇偶游戏。

这是一个经典的游戏，用来决定平局的决胜局或解决比赛。它只需要你的手指。

无限重复的循环赛（例如，使用以下链接中的时间表进行循环赛，然后再次进行，然后再次进行，依此类推，直到教授在某个不可预测的次数后说停止）。
收益矩阵（见下文），收益形式为 [A, B]，因此第一个数字是玩家 A 的收益，第二个数字是玩家 B 的收益。玩家 A 是循环赛时间表中的第一个玩家。
这个游戏奇偶游戏
策略（写下来，暂时保密）
记分（记录你的分数……荣誉制度）
奖品：同伴的敬畏

使用循环赛时间表来确定锦标赛的时间表。

		玩家 B
		奇数	偶数
玩家 A	奇数	[3, 3]	[0, 5]
	偶数	[5, 0]	[1, 1]

讨论

这一切意味着什么？

系统理性与用户理性

以牙还牙与短视的自私

见阿纳托尔·拉波波特，他为类似的基于计算机的策略开发了成功的以牙还牙策略。

博弈论

博弈论关注经济主体的战略互动的一般分析，他们的决策会相互影响。

可以用博弈论分析的问题

拥堵
融资
合并
公交车与汽车
……

每个游戏中的主体是谁？

策略

在博弈论中，支配（也称为战略支配）是指当一个玩家的策略优于另一个策略时，无论该玩家的对手如何行动，都会出现这种情况。许多简单的游戏可以使用支配来解决。相反，非传递性发生在游戏中的一个策略可能比另一个策略更好或更糟，这取决于玩家的对手如何行动。（参考：支配策略）

纳什均衡（NE）：当 A 的选择在 B 的选择下是最佳选择，而 B 的选择在 A 的选择下是最佳选择时，一对策略被定义为 NE。NE 可以被解释为对每个人选择的预期，使得一旦一个人做出自己的选择，两个人都不想改变自己的行为。

如果在一个游戏中，一个玩家存在严格的支配策略，那么该玩家将在游戏的每个纳什均衡中使用该策略。如果两个玩家都有严格的支配策略，那么该游戏只有一个唯一的纳什均衡。但是，该纳什均衡并不一定是帕累托最优的，这意味着游戏可能存在非均衡结果，这对两个玩家都更好。用来说明这一点的经典游戏是囚徒困境。（参考：支配策略）

		玩家 B
		i	j
玩家 A	i	[3,3]*	[2,2]
	j	[2,2]	[1,1]

玩家 A 的收益以单元格中的第一个数字表示，玩家 B 的收益以该单元格中的第二个数字表示。因此策略对 [i,i] 意味着玩家 A 的收益为 3，玩家 B 的收益也为 3。NE 在上面的插图中用星号标出。这代表了一种情况，在这种情况下，每家公司或每个人都在做出最优选择，前提是另一家公司或另一个人的选择。在这里，A 和 B 都明显更喜欢选择 i 而不是选择 j。因此 [i,i] 是一个 NE。

囚徒困境

之前，我们玩了一个有限的一次性游戏和一个无限重复的游戏。这个游戏被设定为所谓的“囚徒困境”。

囚徒困境这个词源于这样一种情况：两个犯罪同伙都被逮捕并分别接受调查。如果他们都“坚持到底”，由于缺乏证据，他们会得到较轻的刑罚（比如各判处 1 年）。如果他们在审讯中都崩溃并认罪，他们将共同承担犯罪的刑期（比如各判处 10 年）。但如果一个人认罪而另一个人不认罪，认罪者会成为污点证人（并获得假释），并帮助定罪另一个人（后者会在监狱里服刑 20 年）

在一次性或有限重复的囚徒困境游戏中，认罪（收费、背叛、偶数）是一种支配策略，当两个囚徒都认罪（州收费、背叛、偶数）时，这是一种支配策略均衡。

博弈论在交通中的应用

边境收费

（基于 Levinson，David (1999) 边境收费：博弈论分析。第十四届交通与交通理论国际研讨会论文集 173-187。）

两个州（特拉华州和新泽西州）被一片水域隔开。它们由一座跨越该水域的桥梁连接。他们应该如何为这座桥梁以及他们其余的道路提供资金？

他们应该收费还是征税？

设 $r_{I}$ 和 $r_{J}$ 是两个司法管辖区的收费。需求是一个负指数函数。（目标是最大化地方福利（居民的效用加上非居民的收费收入（居民的收费收入被视为转移支付）。）

		司法管辖区 J（新泽西州）
		i	j
司法管辖区 I（特拉华州）	i	[1153, 1153]*	[2322,883]
	j	[883, 2322]	[1777,1777]

表格的解读方式如下：每个司法管辖区选择两种策略中的一种（收费或征税）。实际上，司法管辖区 1（特拉华州）选择一行，而司法管辖区 2（新泽西州）选择一列。每个单元格中的两个数字表明了当选择相应的策略对时，两个州的结果。逗号左边的数字表明选择行（特拉华州）的司法管辖区的收益，而逗号右边的数字表明选择列（新泽西州）的州的收益。因此（沿着第一列向下看）如果他们都收费，那么每个州都获得 1153 美元/小时的福利，但如果新泽西州收费而特拉华州征税，那么新泽西州获得 2322 美元，而特拉华州只获得 883 美元。

所以：如何解决这个游戏？如果两个州都希望最大化福利，什么策略是“理性的”？新泽西州可能会这样推理：“会发生两种情况：特拉华州可以收费或特拉华州可以继续征税。假设特拉华州收费。那么如果我不收费，我就只能得到 883 美元，如果我收费，我就得到 1153 美元，所以在这种情况下，收费是最好的。另一方面，如果特拉华州征税而我收费，我就得到 2322 美元，如果我征税，我们都得到 1777 美元。无论哪种方式，我收费都是最好的。因此，我将收费。”

但特拉华州的推理方式类似。因此，他们都收费，并损失了 624 美元/小时。然而，如果他们采取了“非理性”的行为并征税，他们每个州都可以获得 1777 美元/小时。

协调博弈

在英国、日本、澳大利亚和其他一些岛国，人们在道路的左侧行驶；在美国和欧洲大陆，人们在右侧行驶。但是，无论在哪里，每个人都与其他地方的人一样，在同一侧行驶，即使该侧在不同的地方会有所不同。

这种安排是如何实现的？

有两种策略：靠左行驶和靠右行驶。有两种可能的结果：两辆车顺利驶过彼此，或者相撞。我们任意将顺利通过的值分配为 1，将相撞的值分配为 -10。以下是收益表

		奔驰
		左侧	右侧
别克	左侧	[1,1]	[-10,-10]
	右侧	[-10,-10]	[1,1]

(目标：最大化收益)

验证 LL 和 RR 都是纳什均衡。

但是，如果我们不知道选择哪一边，我们可能会随机选择 LR 或 RL 并发生碰撞，存在一些风险。我们如何知道选择哪一边？答案是，当然，对于这个协调博弈，我们依靠社会惯例。相反，我们知道，在这个博弈中，社会惯例非常强大且持久，在解决方案为 LL 的国家也不逊于解决方案为 RR 的国家。

参见左侧或右侧驾驶的歷史討論

博弈论中的问题

什么是“理性”？
当理性策略取决于他人的策略时会发生什么？
如果信息不完整会发生什么？
如果存在不确定性或风险会发生什么？
在什么情况下合作比自私更好？在什么情况下合作是自私的？
持续的互动与一次性事件有何不同？
道德可以从理性的自私中推导出吗？
现实与博弈论有何比较？

思考问题

无限或无限重复的囚徒困境博弈与有限重复或一次性博弈有何不同？为什么？

问题

两家航空公司（美联航，美国航空）分别提供从纽约到洛杉矶的 1 个航班。

价格 = $/pax，收益 = $/航班。

每架飞机载客 500 人。

固定成本为每航班 50000 美元，总需求为 200 美元时为 500 名乘客。

在 400 美元时，总需求为 250 名乘客。

乘客选择最便宜的航班。

收益 = 收入 - 成本

两人合作（4 分钟）

1. 为博弈制定收益矩阵。

2. 什么是均衡？

解决方案

零和

零和博弈：如果我们将博弈中的胜负相加，将损失视为负数，发现对于选择的每组策略，总和为零，那么该博弈就是“零和博弈”。

问题扩展

3. 如果存在第三个价格 300 美元，其需求为 375 名乘客，会发生什么？

重新表述问题。

解决方案

混合策略

混合策略：如果博弈中的玩家以特定概率随机选择两种或多种策略，则这种选择被称为“混合策略”。

进一步应用

Levinson, David (2005) 拥堵和定价的微观基础：博弈论视角。交通研究 A 部分第 39 卷，第 7-9 期，2005 年 8 月 - 11 月，第 691-704 页。
Levinson, David (2000) 串联网络上的收入选择。交通经济与政策杂志 34,1: 69-98。

介绍	交通经济学	数据
	代理