博弈论导论/矩阵表示法
外观
< 博弈论导论
如果你还记得,我们所研究的游戏 - 囚徒困境 - 需要用故事来解释。然而,这不仅过于冗长和不精确,而且对于许多过于复杂的游戏来说也是不可能的。显示一个游戏的一种简单方法是使用游戏矩阵
这实际上是一个效用表。效用是指一个主体(玩家)从特定结果或收益中获得的快乐程度。
为了创建一个游戏矩阵,我们首先需要确定效用值。我们将对玩家最不吸引人的收益分配较低的数值,对玩家最吸引人的收益分配较高的数值。最初[1],这些是我们所谓的“序数”效用值,而不是“基数”效用值。这意味着 10 的收益并不一定比 5 的收益好两倍。事实上,在谈论序数值时,以下两个效用值列表之间没有区别
设置 1 | 设置 2 |
---|---|
Event A = Utility of 1 Event B = Utility of 2 Event C = Utility of 3 |
Event A = Utility of 1 Event B = Utility of 1,000,000 Event C = Utility of 230,000,000,000,000 |
只是第一个列表更简洁。记住,我们从最低吸引力水平到最高吸引力水平,让我们为囚徒困境游戏分配收益。
10 years in jail = 1 7 years in jail = 2 2 years in jail = 3 Get off free = 4
现在我们可以安排一个表,显示每个玩家选择不同选项时会发生什么。
囚徒困境 | 玩家 2 | ||
认罪 | 保持沉默 | ||
玩家 1 | 认罪 | (2,2) | (4,1) |
保持沉默 | (1,4) | (3,3) |
应该很快清楚如何阅读此表。玩家 1 有两行,“认罪”和“保持沉默”,玩家 2 有两列,标记相同。列和行相交的地方是收益。因此,当玩家 1 的“认罪”行与玩家 2 的“保持沉默”列相交时(就游戏而言,当玩家 1 认罪而玩家 2 保持沉默时),收益(4,1)被分配。这意味着玩家 1(其个人收益在括号中排在首位)获得 4 的收益 - 他最高的收益 - 玩家 2 获得 1 的收益 - 最低的。
- ↑ 稍后在谈论预期效用时,我们将把这些值视为“基数”。