两人 A 和 B 正在玩游戏。如果 A 赢了一轮,他从 B 处获得 4 美元,并以 0.7 的概率赢得下一轮。如果 A 输掉了这一轮,他向 B 付款 5 美元,并以 0.5 的概率赢得下一轮。 (i) 写下具有两个状态的马尔可夫链的转移矩阵,{A 赢得当前回合,B 赢得当前回合},并找到状态的平稳概率 (ii) 找出 .
|
(i) 马尔可夫转移矩阵将是 2x2 矩阵
,其中
对应于玩家 A 的胜利,而
对应于玩家 A 的失败。例如,
是玩家 A 在上一局获胜后获胜的概率;
是玩家 A 在上一局失败后获胜的概率;等等。这将给出
平稳分布将是元组
,使得
。我们可以显式地计算它
得到以下方程组:
利用
必须是概率(即
)这一事实,我们得到
.
(ii) 由于
是正的,因此是遍历的,那么任何初始概率分布将收敛到刚刚计算的平稳分布
。因此,随着
,玩家 A 将以概率
获胜。那么玩家 A 可以预期获得更多钱吗?对于足够大的
,我们可以计算玩家 A 在一轮中的预期收益
因此,玩家 A 应该预期以 1 的概率比游戏开始前拥有更多钱。
(i)
,其中倒数第二个不等式是标准的 切比雪夫不等式。
令 是具有有限期望值的随机变量。 (i) 证明 意味着 。 (ii) 证明如果 与 同分布,则
|
(i) 令
。易见
是凸函数。
然后根据 詹森不等式,我们有
。两边取期望得到
.