第三章 完全信息动态博弈(弈论,张醒洲)第三章 完全信息动态博弈(博弈论,张醒洲)第三章 完全信息动态博弈(博弈论,张醒洲)第三章 完全信息动态博弈(博弈论,张醒洲).ppt

第三章 完全信息动态博弈(弈论,张醒洲)第三章 完全信息动态博弈(博弈论,张醒洲)第三章 完全信息动态博弈(博弈论,张醒洲)第三章 完全信息动态博弈(博弈论,张醒洲).ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * 张醒洲 大连理工 2009-03-09 张醒洲 大连理工 * 完全信息动态博弈 Unit 3-1 2009-03-09 张醒洲 大连理工 * 第3章和第4章概要 博弈分类 举例 解的概念 简单的完全且完美信息动态博弈 双寡头垄断模型(1934) 讨价还价模型(1982) 后向归纳结果(BIO) 2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈完美结果 动态博弈主题: 可信威胁与承诺会影响现在的行为 下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈 Subgame-perfect Nash equilibrium 子博弈完美NE 2009-03-09 张醒洲 大连理工 * 第3章概要 完全信息动态博弈 Representation 表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式 Solution concepts 解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想 一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。 2009-03-09 张醒洲 大连理工 * 简单类型的完全且完美信息博弈 两人博弈类型 参与人1从可行集A1中选择一个行动a1 ; 参与者2观察到a1并从可行集A2中选择行动a2 ; 两人的收益分别为u1 (a1, a2) 和 u2 (a1, a2)。 Ex. 斯塔克尔贝里 (1934) 双寡头垄断模型 Tool 后向归纳法 Anticipation 后向归纳结果 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法 简单的完全且完美信息博弈 (CPI) 两个参与人,同时行动 完全且完美信息 举例:斯塔克尔贝里 (1934) 双寡头垄断模型 为了使模型更加一般化,允许更长的行动序列(可以加入更多的参与人或允许参与人行动多于一次) 一个例子. 鲁宾斯坦的讨价还价博弈 为解决简单类型的CPI, 应用后向归纳法求解的过程如下: 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法(续) 第1步 : 分析第二阶段博弈 参与人2的问题: 对参与人1的行动a1 选择最优的反应R2(a1), 参与人2 面临的最优化问题是: 即 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法(续) 请注意这个问题对两个参与人来说是一个共同知识。 因此参与人1可以预测到参与人2对他的行动a1所做出的反应R2(a1)。 第2步: 分析第一阶段 参与人1的问题: 对参与人2的最优反应R2(a1) ,选择最优的行动a1: 即 2009-03-09 张醒洲 大连理工 * 理论:后向归纳法(续) 定义. 简单的完全且完美信息博弈的后向归纳结果是 (a1*, R2(a1*)。 注意到后向归纳结果不包括不可置信的威胁 – 参与人1预测到参与人2是理性的,也就是2会对1可能 选择的A1中的任何行动a1 作出最优反应R2(a1) ; – 并且,参与人1认为参与人2不会选择不符合自身利益 的行动。 下面看一个例子 2009-03-09 张醒洲 大连理工 * 后向归纳法内在的理性假定 一个两个人的三阶段博弈 1.参与人1选择L或R,其中L使博 弈结束,参与人1的收益为2,参与 人2的收益为0; 2. 参与人2观测参与人1的选择。 如果1选择R,则2选择选择L’ 或 R’,其中 L’ 使博弈结束,两人的 收益均为1; 3. 参与人1观察2的选择(并且回 忆自己在第一阶段的选择),如果 前两阶段的选择分别是R 和 R’ ,则 1可选择L’’ 或R’’,每一选择都将结 束博弈,选择L’’ 是参与人1的收益 为3,参与人2的收益为0;选择R’’ 时,1的收益是0,2的收益是2。 2009

您可能关注的文档

文档评论(0)

cxiongxchunj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档