- 0
- 0
- 约5.65千字
- 约 26页
- 2019-02-22 发布于天津
- 举报
动态博弈分析(下).PDF
智能控制
动态博弈分析(下)
吴建设
逆向归纳法
一个例子
策略式(收益矩阵)表述
见右下图。
可见,它有两个纳什均衡:
(3, 1) 和(2, 2)。
如果A选择U, B 的信息集 B
就不可达,即B 的信息集 L R
不在均衡路径上。 A U 2, 2 2, 2
D 3, 1 0, 0
逆向归纳法
逆向归纳法 (Backward Induction)是求
解子博弈精炼纳什均衡的最简便方法。在
求解子博弈精炼纳什均衡时,从最后一个子
博弈开始逆推上去,这就是逆向归纳法。所
以逆向归纳法就是从动态博弈的最后一个
阶段或最后一个子博弈开始,逐步向前倒推
以求解动态博弈均衡的方法。
逆向归纳法
从博弈的最后一个阶段开始分析,若B选择L获利
1, 选择R获利0 ,因此B选L 。
倒退到第一阶段,A选U获利2 ,选D获利取决于B
的选择。
但A知道B是理性的,一旦
到达第二阶段,B肯定选择
L ,从而,A获利3 。因此,
A应该选择D 。
因此,(D, L)是纯策略
纳什均衡。
与策略式分析的比较
逆向归纳法实际上是严格
下策反复删去法在扩展式
描述的动态博弈中的应用。
逆向归纳法不适合无限
博弈。
逆向归纳法不适合不
完美信息博弈。 B
L R
逆向归纳法剔出了非
A U 2, 2 2, 2
理性的均衡策略。 D 3, 1 0, 0
逆推归纳法:海盗分赃
5个海盗抢来100个金币,大家决定分赃的
方式是:由海盗一提出一种分配方案,如果同
意该方案的人数达到半数,则该提议通过并实
施。否则该提议人将被扔进大海,然后由接下
来的海盗重复提议过程。
假定每个人都绝顶聪明,也不相互合作,并
且极度自私,那么第一个海盗该如何提议。
逆推归纳法:海盗分赃
逆推归纳法的求解思路如下:
首先考虑只剩下最后一个海盗:海盗5,其他四个海盗
已经被扔进大海,显然,他会分给自己100金币,自己
同意并通过。
逆推到只剩下海盗4和海盗5的情况,海盗4会分给自己
100金币,不给海盗5分。海盗4 自己同意并通过,海盗5
反对但无用。
再回到海盗3,海盗3会给海盗5一枚金币以获取他的支
持,给自己99枚,海盗 3和海盗5同意并通过。
逆推归纳法:海盗分赃
逆推归纳法的求解思路如下:
回到海盗2,他分给海盗4一枚 金币,以获
取海盗4的支持,分给 海盗3和海盗5零枚
金币,海盗2和海盗4同意并通过,海盗3和
海盗5 反对但无用。
逆推归纳法:海
原创力文档

文档评论(0)