第三章完全信息动态博弈(弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲).ppt

下载文档 降价啦

10
0
约4.65千字
约 24页
2017-03-18 发布于贵州
举报
版权申诉
保障服务

第三章完全信息动态博弈(弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲).ppt

1、本文档共24页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* * * * * * * * * * * * * * * * * 张醒洲大连理工 2009-03-09 张醒洲大连理工 * 完全信息动态博弈 Unit 3-1 2009-03-09 张醒洲大连理工 * 第3章和第4章概要博弈分类举例解的概念简单的完全且完美信息动态博弈双寡头垄断模型(1934) 讨价还价模型(1982) 后向归纳结果(BIO) 2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈完美结果动态博弈主题: 可信威胁与承诺会影响现在的行为下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈 Subgame-perfect Nash equilibrium 子博弈完美NE 2009-03-09 张醒洲大连理工 * 第3章概要完全信息动态博弈 Representation 表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式 Solution concepts 解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想一个完全信息动态博弈可能会有很多个纳什均衡，但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。 2009-03-09 张醒洲大连理工 * 简单类型的完全且完美信息博弈两人博弈类型参与人1从可行集A1中选择一个行动a1 ；参与者2观察到a1并从可行集A2中选择行动a2 ；两人的收益分别为u1 (a1, a2) 和 u2 (a1, a2)。 Ex. 斯塔克尔贝里 (1934) 双寡头垄断模型 Tool 后向归纳法 Anticipation 后向归纳结果 2009-03-09 张醒洲大连理工 * 理论：后向归纳法简单的完全且完美信息博弈 (CPI) 两个参与人，同时行动完全且完美信息举例：斯塔克尔贝里 (1934) 双寡头垄断模型为了使模型更加一般化,允许更长的行动序列（可以加入更多的参与人或允许参与人行动多于一次）一个例子. 鲁宾斯坦的讨价还价博弈为解决简单类型的CPI, 应用后向归纳法求解的过程如下： 2009-03-09 张醒洲大连理工 * 理论：后向归纳法（续）第1步 : 分析第二阶段博弈参与人2的问题: 对参与人1的行动a1 选择最优的反应R2(a1), 参与人2 面临的最优化问题是: 即 2009-03-09 张醒洲大连理工 * 理论：后向归纳法（续）请注意这个问题对两个参与人来说是一个共同知识。因此参与人1可以预测到参与人2对他的行动a1所做出的反应R2(a1)。第2步: 分析第一阶段参与人1的问题: 对参与人2的最优反应R2(a1) ，选择最优的行动a1：即 2009-03-09 张醒洲大连理工 * 理论：后向归纳法（续）定义. 简单的完全且完美信息博弈的后向归纳结果是 (a1*, R2(a1*)。注意到后向归纳结果不包括不可置信的威胁 – 参与人1预测到参与人2是理性的，也就是2会对1可能选择的A1中的任何行动a1 作出最优反应R2(a1) ； – 并且，参与人1认为参与人2不会选择不符合自身利益的行动。下面看一个例子 2009-03-09 张醒洲大连理工 * 后向归纳法内在的理性假定一个两个人的三阶段博弈 1.参与人1选择L或R，其中L使博弈结束，参与人1的收益为2，参与人2的收益为0； 2. 参与人2观测参与人1的选择。如果1选择R，则2选择选择L’ 或 R’，其中 L’ 使博弈结束，两人的收益均为1； 3. 参与人1观察2的选择（并且回忆自己在第一阶段的选择），如果前两阶段的选择分别是R 和 R’ ，则 1可选择L’’ 或R’’，每一选择都将结束博弈，选择L’’ 是参与人1的收益为3，参与人2的收益为0；选择R’’ 时，1的收益是0，2的收益是2。 2009

您可能关注的文档

文档评论（0）

cxiongxchunj + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第三章完全信息动态博弈(弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲)第三章完全信息动态博弈(博弈论,张醒洲).ppt