第475章 逆向归纳法

职场小聪明 翟晓鹰 1670 字 3天前

逆向归纳法(Backward Induction)

逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。

这种方法通常用于有限步博弈(finite games),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。

逆向归纳法的基本步骤

1. 从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。

2. 回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。

3. 重复以上过程,直至回溯到起点:最终得出的策略就是整个博弈的最优均衡解。

案例分析

1. 终局博弈(Ultimatum Game)

假设有两个玩家:

? A玩家分配100元,决定给B玩家多少钱(整数)。

? B玩家可以选择接受(Accept)或拒绝(Reject):

? 如果接受,双方按A的分配拿钱。

? 如果拒绝,双方都拿不到钱。

逆向归纳分析

1. B的决策(最后一步):

? 如果B接受,他能获得分配到的钱。

? 如果B拒绝,双方都拿不到钱。

? 理性B玩家应接受任何非零金额,因为比0更好。

2. A的决策(回溯):

? A知道B会接受任何非零金额,所以A的最优策略是给B最少的钱(如1元),自己拿99元。

结论:A分1元,B接受,这是均衡策略。

2. 进入威胁博弈(Entry Deterrence Game)

假设一个新企业(E)考虑进入市场,而已有企业(I)可以选择降价竞争(Fierce)或维持高价(Acmodate)。

博弈树

1. E决定是否进入市场:

? 进入(Enter)

? 不进入(Stay Out)

2. 如果E进入,I决定策略:

? 降价(Fierce):I 和 E 都亏损 -10。

? 高价(Acmodate):I赚10,E赚5。

? E不进入(Stay Out):I独占市场,赚15,E赚0。

逆向归纳分析

1. I的决策(最后一步):

? 如果E已进入,I在降价(-10)和高价(10)之间选择,高价更优,所以I会选择高价。

2. E的决策(回溯):

? 知道I不会降价,E进入后可以赚5(比0好),所以E会进入市场。

结论:E进入,I维持高价,这是均衡策略。

3. 百吉饼博弈(Centipede Game)

假设有两个玩家轮流决定**“拿走(Take)”还是“继续(Pass)”**奖金池:

? 初始奖金池2元,每轮增加。