跳转到内容

交通经济学/博弈

来自维基教科书,开放世界中的开放书籍

一个游戏

[编辑 | 编辑源代码]

首先,让我们玩奇偶游戏。

这是一个经典的游戏,用来决定平局的决胜局或解决比赛。它只需要你的手指。

  1. 无限重复的循环赛(例如,使用以下链接中的时间表进行循环赛,然后再次进行,然后再次进行,依此类推,直到教授在某个不可预测的次数后说停止)。
  2. 收益矩阵(见下文),收益形式为 [A, B],因此第一个数字是玩家 A 的收益,第二个数字是玩家 B 的收益。玩家 A 是循环赛时间表中的第一个玩家。
  3. 这个游戏 奇偶游戏
  4. 策略(写下来,暂时保密)
  5. 记分(记录你的分数……荣誉制度)
  6. 奖品:同伴的敬畏

使用 循环赛时间表 来确定锦标赛的时间表。

玩家 B
奇数 偶数
玩家 A 奇数 [3, 3] [0, 5]
偶数 [5, 0] [1, 1]

这一切意味着什么?

系统理性与用户理性

以牙还牙与短视的自私

阿纳托尔·拉波波特,他为类似的基于计算机的策略开发了成功的以牙还牙策略。

博弈论

[编辑 | 编辑源代码]

博弈论关注经济主体的战略互动的一般分析,他们的决策会相互影响。

可以用博弈论分析的问题

  • 拥堵
  • 融资
  • 合并
  • 公交车与汽车
  • ……

每个游戏中的主体是谁?

在博弈论中,支配(也称为战略支配)是指当一个玩家的策略优于另一个策略时,无论该玩家的对手如何行动,都会出现这种情况。许多简单的游戏可以使用支配来解决。相反,非传递性发生在游戏中的一个策略可能比另一个策略更好或更糟,这取决于玩家的对手如何行动。(参考:支配策略

纳什均衡(NE):当 A 的选择在 B 的选择下是最佳选择,而 B 的选择在 A 的选择下是最佳选择时,一对策略被定义为 NE。NE 可以被解释为对每个人选择的预期,使得一旦一个人做出自己的选择,两个人都不想改变自己的行为。

如果在一个游戏中,一个玩家存在严格的支配策略,那么该玩家将在游戏的每个纳什均衡中使用该策略。如果两个玩家都有严格的支配策略,那么该游戏只有一个唯一的纳什均衡。但是,该纳什均衡并不一定是帕累托最优的,这意味着游戏可能存在非均衡结果,这对两个玩家都更好。用来说明这一点的经典游戏是囚徒困境。(参考:支配策略

玩家 B
i j
玩家 A i [3,3]* [2,2]
j [2,2] [1,1]

玩家 A 的收益以单元格中的第一个数字表示,玩家 B 的收益以该单元格中的第二个数字表示。因此策略对 [i,i] 意味着玩家 A 的收益为 3,玩家 B 的收益也为 3。NE 在上面的插图中用星号标出。这代表了一种情况,在这种情况下,每家公司或每个人都在做出最优选择,前提是另一家公司或另一个人的选择。在这里,A 和 B 都明显更喜欢选择 i 而不是选择 j。因此 [i,i] 是一个 NE。

囚徒困境

[编辑 | 编辑源代码]

之前,我们玩了一个有限的一次性游戏和一个无限重复的游戏。这个游戏被设定为所谓的“囚徒困境”。

囚徒困境这个词源于这样一种情况:两个犯罪同伙都被逮捕并分别接受调查。如果他们都“坚持到底”,由于缺乏证据,他们会得到较轻的刑罚(比如各判处 1 年)。如果他们在审讯中都崩溃并认罪,他们将共同承担犯罪的刑期(比如各判处 10 年)。但如果一个人认罪而另一个人不认罪,认罪者会成为污点证人(并获得假释),并帮助定罪另一个人(后者会在监狱里服刑 20 年)

在一次性或有限重复的囚徒困境游戏中,认罪(收费、背叛、偶数)是一种支配策略,当两个囚徒都认罪(州收费、背叛、偶数)时,这是一种支配策略均衡。


博弈论在交通中的应用

[编辑 | 编辑源代码]

边境收费

[编辑 | 编辑源代码]

(基于 Levinson,David (1999) 边境收费:博弈论分析。第十四届交通与交通理论国际研讨会论文集 173-187。)

两个州(特拉华州和新泽西州)被一片水域隔开。它们由一座跨越该水域的桥梁连接。他们应该如何为这座桥梁以及他们其余的道路提供资金?

他们应该收费还是征税?

是两个司法管辖区的收费。需求是一个负指数函数。(目标是最大化地方福利(居民的效用加上非居民的收费收入(居民的收费收入被视为转移支付)。)

司法管辖区 J(新泽西州)
i j
司法管辖区 I(特拉华州) i [1153, 1153]* [2322,883]
j [883, 2322] [1777,1777]

表格的解读方式如下:每个司法管辖区选择两种策略中的一种(收费或征税)。实际上,司法管辖区 1(特拉华州)选择一行,而司法管辖区 2(新泽西州)选择一列。每个单元格中的两个数字表明了当选择相应的策略对时,两个州的结果。逗号左边的数字表明选择行(特拉华州)的司法管辖区的收益,而逗号右边的数字表明选择列(新泽西州)的州的收益。因此(沿着第一列向下看)如果他们都收费,那么每个州都获得 1153 美元/小时的福利,但如果新泽西州收费而特拉华州征税,那么新泽西州获得 2322 美元,而特拉华州只获得 883 美元。

所以:如何解决这个游戏?如果两个州都希望最大化福利,什么策略是“理性的”?新泽西州可能会这样推理:“会发生两种情况:特拉华州可以收费或特拉华州可以继续征税。假设特拉华州收费。那么如果我不收费,我就只能得到 883 美元,如果我收费,我就得到 1153 美元,所以在这种情况下,收费是最好的。另一方面,如果特拉华州征税而我收费,我就得到 2322 美元,如果我征税,我们都得到 1777 美元。无论哪种方式,我收费都是最好的。因此,我将收费。”

但特拉华州的推理方式类似。因此,他们都收费,并损失了 624 美元/小时。然而,如果他们采取了“非理性”的行为并征税,他们每个州都可以获得 1777 美元/小时。

协调博弈

[编辑 | 编辑源代码]

在英国、日本、澳大利亚和其他一些岛国,人们在道路的左侧行驶;在美国和欧洲大陆,人们在右侧行驶。但是,无论在哪里,每个人都与其他地方的人一样,在同一侧行驶,即使该侧在不同的地方会有所不同。

这种安排是如何实现的?

有两种策略:靠左行驶和靠右行驶。有两种可能的结果:两辆车顺利驶过彼此,或者相撞。我们任意将顺利通过的值分配为 1,将相撞的值分配为 -10。以下是收益表

奔驰
左侧 右侧
别克 左侧 [1,1] [-10,-10]
右侧 [-10,-10] [1,1]

(目标:最大化收益)

验证 LL 和 RR 都是纳什均衡。

但是,如果我们不知道选择哪一边,我们可能会随机选择 LR 或 RL 并发生碰撞,存在一些风险。我们如何知道选择哪一边?答案是,当然,对于这个协调博弈,我们依靠社会惯例。相反,我们知道,在这个博弈中,社会惯例非常强大且持久,在解决方案为 LL 的国家也不逊于解决方案为 RR 的国家。

参见 左侧或右侧驾驶的歷史討論


博弈论中的问题

[编辑 | 编辑源代码]
  • 什么是“理性”?
  • 当理性策略取决于他人的策略时会发生什么?
  • 如果信息不完整会发生什么?
  • 如果存在不确定性或风险会发生什么?
  • 在什么情况下合作比自私更好?在什么情况下合作是自私的?
  • 持续的互动与一次性事件有何不同?
  • 道德可以从理性的自私中推导出吗?
  • 现实与博弈论有何比较?

思考问题

[编辑 | 编辑源代码]

无限或无限重复的囚徒困境博弈与有限重复或一次性博弈有何不同?为什么?

两家航空公司(美联航,美国航空)分别提供从纽约到洛杉矶的 1 个航班。

价格 = $/pax,收益 = $/航班。

每架飞机载客 500 人。

固定成本为每航班 50000 美元,总需求为 200 美元时为 500 名乘客。

在 400 美元时,总需求为 250 名乘客。

乘客选择最便宜的航班。

收益 = 收入 - 成本

两人合作(4 分钟)

1. 为博弈制定收益矩阵。

2. 什么是均衡?

解决方案

[编辑 | 编辑源代码]

零和博弈:如果我们将博弈中的胜负相加,将损失视为负数,发现对于选择的每组策略,总和为零,那么该博弈就是“零和博弈”。

问题扩展

[编辑 | 编辑源代码]

3. 如果存在第三个价格 300 美元,其需求为 375 名乘客,会发生什么?

重新表述问题。

解决方案

[编辑 | 编辑源代码]

混合策略

[编辑 | 编辑源代码]

混合策略:如果博弈中的玩家以特定概率随机选择两种或多种策略,则这种选择被称为“混合策略”。

进一步应用

[编辑 | 编辑源代码]


Previous page
介绍
交通经济学 Next page
数据
代理
华夏公益教科书