第三章完全信息动态博弈博弈论,张醒洲.pptVIP

  • 3
  • 0
  • 约4.65千字
  • 约 24页
  • 2017-02-04 发布于江苏
  • 举报

第三章完全信息动态博弈博弈论,张醒洲.ppt

* * * * * * * * * * * * * * * * * 张醒洲 大连理工 2009-03-09 张醒洲 大连理工 * 完全信息动态博弈 Unit 3-1 2009-03-09 张醒洲 大连理工 * 第3章和第4章概要 博弈分类 举例 解的概念 简单的完全且完美信息动态博弈 双寡头垄断模型(1934) 讨价还价模型(1982) 后向归纳结果(BIO) 2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈完美结果 动态博弈主题: 可信威胁与承诺会影响现在的行为 下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈 Subgame-perfect Nash equilibrium 子博弈完美NE 2009-03-09 张醒洲 大连理工 * 第3章概要 完全信息动态博弈 Representation 表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式 Solution concepts 解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想 一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。 2009-03-09 张醒洲 大连理工 * 简单类型的完全且完美信息博弈 两人博弈类型 参与人1从可行集A1中选择一个行动a1 ; 参与者2观察到a1并从可行集A2中选择行动a2 ; 两人的收益分别为u1 (a1, a2) 和 u2 (a1, a2)。 Ex. 斯塔克尔贝里 (1934) 双寡头垄断模型 Tool 后向归纳法 Anticipation 后向归纳结果 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法 简单的完全且完美信息博弈 (CPI) 两个参与人,同时行动 完全且完美信息 举例:斯塔克尔贝里 (1934) 双寡头垄断模型 为了使模型更加一般化,允许更长的行动序列(可以加入更多的参与人或允许参与人行动多于一次) 一个例子. 鲁宾斯坦的讨价还价博弈 为解决简单类型的CPI, 应用后向归纳法求解的过程如下: 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法(续) 第1步 : 分析第二阶段博弈 参与人2的问题: 对参与人1的行动a1 选择最优的反应R2(a1), 参与人2 面临的最优化问题是: 即 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法(续) 请注意这个问题对两个参与人来说是一个共同知识。 因此参与人1可以预测到参与人2对他的行动a1所做出的反应R2(a1)。 第2步: 分析第一阶段 参与人1的问题: 对参与人2的最优反应R2(a1) ,选择最优的行动a1: 即 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法(续) 定义. 简单的完全且完美信息博弈的后向归纳结果是 (a1*, R2(a1*)。 注意到后向归纳结果不包括不可置信的威胁 – 参与人1预测到参与人2是理性的,也就是2会对1可能 选择的A1中的任何行动a1 作出最优反应R2(a1) ; – 并且,参与人1认为参与人2不会选择不符合自身利益 的行动。 下面看一个例子 2009-03-09 张醒洲 大连理工 * 后向归纳法内在的理性假定 一个两个人的三阶段博弈 1.参与人1选择L或R,其中L使博 弈结束,参与人1的收益为2,参与 人2的收益为0; 2. 参与人2观测参与人1的选择。 如果1选择R,则2选择选择L’ 或 R’,其中 L’ 使博弈结束,两人的 收益均为1; 3. 参与人1观察2的选择(并且回 忆自己在第一阶段的选择),如果 前两阶段的选择分别是R 和 R’ ,则 1可选择L’’ 或R’’,每一选择都将结 束博弈,选择L’’ 是参与人1的收益 为3,参与人2的收益为0;选择R’’ 时,1的收益是0,2的收益是2。 2009

文档评论(0)

1亿VIP精品文档

相关文档