跳转到内容

博弈论导论/矩阵表示法

来自维基教科书,开放的书籍,开放的世界

如果你还记得,我们所研究的游戏 - 囚徒困境 - 需要用故事来解释。然而,这不仅过于冗长和不精确,而且对于许多过于复杂的游戏来说也是不可能的。显示一个游戏的一种简单方法是使用游戏矩阵

这实际上是一个效用表。效用是指一个主体(玩家)从特定结果或收益中获得的快乐程度。

为了创建一个游戏矩阵,我们首先需要确定效用值。我们将对玩家最不吸引人的收益分配较低的数值,对玩家最吸引人的收益分配较高的数值。最初[1],这些是我们所谓的“序数”效用值,而不是“基数”效用值。这意味着 10 的收益并不一定比 5 的收益好两倍。事实上,在谈论序数值时,以下两个效用值列表之间没有区别

设置 1 设置 2
Event A = Utility of 1
Event B = Utility of 2
Event C = Utility of 3
Event A = Utility of 1
Event B = Utility of 1,000,000
Event C = Utility of 230,000,000,000,000

只是第一个列表更简洁。记住,我们从最低吸引力水平到最高吸引力水平,让我们为囚徒困境游戏分配收益。

10 years in jail = 1
7 years in jail  = 2
2 years in jail  = 3
Get off free   = 4

现在我们可以安排一个表,显示每个玩家选择不同选项时会发生什么。

囚徒困境 玩家 2
认罪 保持沉默
玩家 1 认罪 (2,2) (4,1)
保持沉默 (1,4) (3,3)

应该很快清楚如何阅读此表。玩家 1 有两行,“认罪”和“保持沉默”,玩家 2 有两列,标记相同。列和行相交的地方是收益。因此,当玩家 1 的“认罪”行与玩家 2 的“保持沉默”列相交时(就游戏而言,当玩家 1 认罪而玩家 2 保持沉默时),收益(4,1)被分配。这意味着玩家 1(其个人收益在括号中排在首位)获得 4 的收益 - 他最高的收益 - 玩家 2 获得 1 的收益 - 最低的。

  1. 稍后在谈论预期效用时,我们将把这些值视为“基数”。

囚徒困境 · 性别之战

华夏公益教科书