- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 完全信息动态博弈 更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。而这一章,我们将围绕这子博弈完美均衡来展开。 第一节 完美信息与完全但不完美信息 完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。我们不妨用两个例子来加以说明。 例4.1 动态囚徒困境 例4.2 取消管制 定义4.1 完美信息动态博弈就是不存在同时行动的完全信息动态博弈。 显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。 第二节 动态博弈的扩展式 现在我们将例4.1和例4.2的扩展式表达如下: 第三节 策略和结果 策略是“万全之策”,而不再是单纯的行动,如何理解这句话呢? 1、动态囚徒困境中囚徒2的策略 表4-1 囚徒2的四个策略 2、蜈蚣博弈中参与者1的策略 关键是理解DL,DR也是策略。 所以说,策略是一个“万全之策”。 定义4.3 对于博弈,参与者P(h)的一个策略sP(h)(h)就是一个函数,它将每一个可能的历史h映射成行动空间AP(h)(h)中的一个行动ap(h)。 上述策略的定义实际上就是指当历史进行到某个阶段时,当轮到参与者i行动时,规定了他如何行动。例如,在蜈蚣博弈中,对于参与者1而言,一个策略就是当历史为空历史时,规定了参与者1如何行动,当历史为(C, C)时,规定了参与者1又如何行动, 因而DL和DR就是参与者1的策略,至于历史(C, C)会不会发生那是另外一个问题,策略所要求的就是一旦出现了某个历史我应该如何做,而不能出现不知所措的情况。 通过上面的说明我们看到,有什么样的策略组合就会有什么样的历史,但历史并不等于策略。为此,我们引入结果函数,即对于任意 ,存在某个,使得O(s) = h。参与者的收益函数u就是定义在结果上的函数。 例如,在蜈蚣博弈中,可知参与者1有四个策略CL、CR、DL和DR,参与者2有两个策略C和D,因而策略组合有8个,其相应的结果函数为 O(CL, C)=(CCL) ? u1(O(CL, C)) = 1和u2(O(CL, C)) = 2; O(CR, C)=(CCR) ?u1(O(CR, C)) = 0和u2(O(CR, C)) = 0; O(Cx, D)=(CD) ?u1(O(Cx, D)) = 3和u2(O(Cx, D)) = 1; O(Dx, x)=(D) ? u1(O(Dx, x)) = 2和u2(O(Dx, x)) = 0。 其中x代表任意行动。上面的结果函数给了我们两点启示:一是,要得到全历史实际上只需行动计划就可以了,不一定需要去考察所谓的“完全之策”,例如,O(D, x)=D=O(Dx, x)是一样的,这样做的好处是能够简化分析,但在观念上,我们必须牢记策略是“万全之策”。二是,图4-5的蜈蚣博弈实际上与图4-6中的博弈完全等价,这就更为直观地指出了策略DL和DR的性质。实际上,汤普森(Thompson, 1952)论证了对于任意两个等价的扩展式博弈,至少存在4种转换方式,通过转换,可以把复杂的扩展式博弈变成最简单的形式去分析。 3、紧跟领导者(follow leader)博弈的策略 第四节 纳什均衡与子博弈完美均衡 一、纳什均衡 纳什均衡概念的核心就在于,每一个参与者的策略都是给定其他参与者策略下的最优反应,并且对任意参与者成立。即便博弈是动态的,这一点也不会改变。那么,将静态博弈中的纳什均衡概念运用到动态博弈中应该是一个不错的思路,尽管这样做可能存在问题。 二、承诺与威胁 动态博弈中会出现先行动,后行动的问题。 承诺和威胁是否可信,是动态博弈中先行动的参与人是否该相信后行动的参与人选择某个行动的判断的问题。后行动的参与人所选择的行动对先行动参与人有利的,那么,后行动参与人的这一选择对先行动参与人来说是一种承诺,相反,如果不利,那么,后行动参与人的这一选择对先行动参与人来说是一种威胁。 定义:一个威胁或承诺,如果发出这一信息的人执行它比不执行它花费更多的成本,则称为不可置信的威胁或承诺。 c1c2等表示一个向量,每个向量的第一个行
您可能关注的文档
- 第3节 安全用电专用课件.ppt
- 第3讲 简单的逻辑联结词、全称量词与存在量词专用课件.ppt
- 第3节 肾小管和集合管 物质的转运功能专用课件.ppt
- 第3讲 类型电影理论专用课件.ppt
- 第3讲 犯罪人专用课件.ppt
- 第3讲 齐专用课件.ppt
- 第3讲(条件概率、乘法公式与全概率公式)专用课件.ppt
- 第3课 两次工业革命专用课件.ppt
- 第3课 百科全书式的学者亚里士多德供参习.doc
- 第3课 边城供参习.doc
- Unit4MyFavoriteSubjectSectionA(1a-Pronunciation)(课件)人教版七年级英语上册.pptx
- Unit4NaturalDisastersListeningandSpeaking课件-高中英语人教版.pptx
- Unit4NaturalDisastersReadingandThinking课件高中英语人教版(1).pptx
- Unit4MyFavouriteSubjectSectionApronunciation课件-人教版七年级英语上册.pptx
- Unit4MyFavouriteSubjectSectionB(1a-1d)(教学课件)人教版英语七年级上册.pptx
- Unit4Lesson1课件冀教版七年级英语上册.pptx
- Unit4Lesson3课件冀教版英语七年级上册.pptx
- Unit4NaturalDisasters词汇笔记清单-高一上学期英语人教版.docx
- Unit4Lesson2课件冀教版英语七年级上册.pptx
- Unit4IusedtobeafraidofthedarkSectionAGrammarFocus-4c课件人教版(2012)九年级英语全册.pptx
文档评论(0)