第三章完全信息动态博弈博弈论,张醒洲.pptVIP

下载本文档

3
0
约4.65千字
约 24页
2017-02-04 发布于江苏
举报

第三章完全信息动态博弈博弈论,张醒洲.ppt

* * * * * * * * * * * * * * * * * 张醒洲大连理工 2009-03-09 张醒洲大连理工 * 完全信息动态博弈 Unit 3-1 2009-03-09 张醒洲大连理工 * 第3章和第4章概要博弈分类举例解的概念简单的完全且完美信息动态博弈双寡头垄断模型(1934) 讨价还价模型(1982) 后向归纳结果(BIO) 2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈完美结果动态博弈主题: 可信威胁与承诺会影响现在的行为下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈 Subgame-perfect Nash equilibrium 子博弈完美NE 2009-03-09 张醒洲大连理工 * 第3章概要完全信息动态博弈 Representation 表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式 Solution concepts 解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想一个完全信息动态博弈可能会有很多个纳什均衡，但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。 2009-03-09 张醒洲大连理工 * 简单类型的完全且完美信息博弈两人博弈类型参与人1从可行集A1中选择一个行动a1 ；参与者2观察到a1并从可行集A2中选择行动a2 ；两人的收益分别为u1 (a1, a2) 和 u2 (a1, a2)。 Ex. 斯塔克尔贝里 (1934) 双寡头垄断模型 Tool 后向归纳法 Anticipation 后向归纳结果 2009-03-09 张醒洲大连理工 * 理论：后向归纳法简单的完全且完美信息博弈 (CPI) 两个参与人，同时行动完全且完美信息举例：斯塔克尔贝里 (1934) 双寡头垄断模型为了使模型更加一般化,允许更长的行动序列（可以加入更多的参与人或允许参与人行动多于一次）一个例子. 鲁宾斯坦的讨价还价博弈为解决简单类型的CPI, 应用后向归纳法求解的过程如下： 2009-03-09 张醒洲大连理工 * 理论：后向归纳法（续）第1步 : 分析第二阶段博弈参与人2的问题: 对参与人1的行动a1 选择最优的反应R2(a1), 参与人2 面临的最优化问题是: 即 2009-03-09 张醒洲大连理工 * 理论：后向归纳法（续）请注意这个问题对两个参与人来说是一个共同知识。因此参与人1可以预测到参与人2对他的行动a1所做出的反应R2(a1)。第2步: 分析第一阶段参与人1的问题: 对参与人2的最优反应R2(a1) ，选择最优的行动a1：即 2009-03-09 张醒洲大连理工 * 理论：后向归纳法（续）定义. 简单的完全且完美信息博弈的后向归纳结果是 (a1*, R2(a1*)。注意到后向归纳结果不包括不可置信的威胁 – 参与人1预测到参与人2是理性的，也就是2会对1可能选择的A1中的任何行动a1 作出最优反应R2(a1) ； – 并且，参与人1认为参与人2不会选择不符合自身利益的行动。下面看一个例子 2009-03-09 张醒洲大连理工 * 后向归纳法内在的理性假定一个两个人的三阶段博弈 1.参与人1选择L或R，其中L使博弈结束，参与人1的收益为2，参与人2的收益为0； 2. 参与人2观测参与人1的选择。如果1选择R，则2选择选择L’ 或 R’，其中 L’ 使博弈结束，两人的收益均为1； 3. 参与人1观察2的选择（并且回忆自己在第一阶段的选择），如果前两阶段的选择分别是R 和 R’ ，则 1可选择L’’ 或R’’，每一选择都将结束博弈，选择L’’ 是参与人1的收益为3，参与人2的收益为0；选择R’’ 时，1的收益是0，2的收益是2。 2009

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第三章完全信息动态博弈博弈论,张醒洲.pptVIP