两人 A 和 B 正在玩游戏。如果 A 赢了一轮,他从 B 处获得 4 美元,并以 0.7 的概率赢得下一轮。如果 A 输掉了这一轮,他向 B 付款 5 美元,并以 0.5 的概率赢得下一轮。 (i) 写下具有两个状态的马尔可夫链的转移矩阵,{A 赢得当前回合,B 赢得当前回合},并找到状态的平稳概率 (ii) 找出 .
|
(i) 马尔可夫转移矩阵将是 2x2 矩阵 ,其中 对应于玩家 A 的胜利,而 对应于玩家 A 的失败。例如, 是玩家 A 在上一局获胜后获胜的概率; 是玩家 A 在上一局失败后获胜的概率;等等。这将给出
平稳分布将是元组 ,使得 。我们可以显式地计算它
得到以下方程组: 利用 必须是概率(即 )这一事实,我们得到 .
(ii) 由于 是正的,因此是遍历的,那么任何初始概率分布将收敛到刚刚计算的平稳分布 。因此,随着 ,玩家 A 将以概率 获胜。那么玩家 A 可以预期获得更多钱吗?对于足够大的 ,我们可以计算玩家 A 在一轮中的预期收益
因此,玩家 A 应该预期以 1 的概率比游戏开始前拥有更多钱。
(i) ,其中倒数第二个不等式是标准的 切比雪夫不等式。
令 是具有有限期望值的随机变量。 (i) 证明 意味着 。 (ii) 证明如果 与 同分布,则
|
(i) 令 。易见 是凸函数。
然后根据 詹森不等式,我们有
。两边取期望得到
.