第7章不完全信息与声誉.pptVIP

下载本文档

4
0
约3.21千字
约 33页
2017-09-25 发布于上海
举报
版权申诉

第7章不完全信息与声誉.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第7章不完全信息与声誉张维迎教授北京大学光华管理学院有限次博弈第6章证明，只要未来足够重要，合作行为可以是无限次重复博弈的精炼纳什均衡。但是，现实中许多博弈是有限次的，不是无限次的。如果博弈重复的次数是有限的，无论重复多少次，合作都不会出现。 “连锁店悖论”(chain-store paradox) Selten (1978); 逆向归纳假定在位者有20个市场。直观告诉我们，如果进入者在第一个市场进入，在位者应该选择斗争，因为尽管从一个市场看，斗争是不值得的，但这样做可以遏止进入者在其他市场上的进入。唯一的精炼纳什均衡是：进入者总是进入；在位者总是默许。问题在哪里？一个可能的原因在于：我们前面假定不仅参与人的理性是共同知识，而且每个参与人可以选择的战略和效用函数都是共同知识。但现实不是这样。可能性：逆向归纳方法的问题（理性共识）；信息不完全；正如我们前面讨论的谈判情况：如果信息是完全的，谈判一开始就达成协议，但现实中的谈判不是这样，原因在于信息不对称。不完全信息 KMRW模型（1982）；如果参与人对其他参与人的效用函数和战略空间的信息不完全，即使博弈重复的次数是有限的，人们也有积极性建立一个合作的声誉(reputation)，合作会出现。单方不完全信息假定有两个参与人，A和B，进行囚徒困境博弈。如下图。参与人A有两中可能的类型：“非理性”型：只有一种战略，tit-for-tat (TFT)，或者grim strategy, 概率为p; “理性”型：可以选择任何战略，概率为（1-p）；参与人B有一种类型：理性型。对“非理性”的解释特殊的成本函数或效用函数；讲义气、重情谊的人；内在化了 reciprocity 社会规范的人；认知问题；博弈重复两次第2阶段参与人A：如果是理性的，选择“背叛”；如果是非理性的，选择B在第1阶段的行动（X）；参与人B：选择“背叛”。第1阶段参与人A：如果是非理性的，选择“合作”；如果是理性的，选择“背叛”；参与人B：如果选择合作，面临被背叛的风险，但如果A是非理性的，可以换来第2阶段的合作。 B在第2阶段的选择选择合作，期望效用是： 3p+(-1)(1-p)+4p+0(1-p)=8p-1 如果选择背叛，期望效用函数是： 4p+0(1-p)+0=4p 最优选择是合作，如果：p=0.25; 结论：如果B认为A非理性的概率不小于0.25, B在第1阶段会选择合作，即使博弈只重复两次。博弈重复3次参与人A（理性）的选择如果A是理性的，在第2阶段和第3阶段一定会选择背叛，但第1阶段也可能选择合作，因为建立一个合作的形象可以换取B在第2阶段的合作；如果p=0.25, 并且A认为B在第1阶段会合作，给定A在第2阶段合作的话B在在第2阶段也会合作，那么A选择合作得到：3+4+0=5；如果A选择背叛，得到：4+0+0=4；所以合作是最优的。参与人B的选择 B有四种战略：（合作，合作，背叛）；（合作，背叛，背叛）；（背叛，背叛，背叛）；（背叛，合作，背叛）结论只要p=0.25, 下表所列战略组合是一个精炼纳什均衡：理性型A在第1阶段选择合作，然后在第2和第3阶段选择背叛； B在第1和第2阶段选择合作，然后在第3阶段背叛。一般结论可以证明：如果博弈重复T次，只要p=0.25, 对于所有的T=3, 下列战略组合构成一个精炼纳什均衡：理性型A在t=1….T-2阶段选择合作，在T-1和T阶段选择背叛；B在t=1….T-1阶段选择合作，在最后阶段T选择背叛。背叛只在最后两阶段出现。双方不完全信息在单方不完全信息下，只要p0.25，不论博弈重复多少次，合作都不会出现。但如果双方信息不完全，即使小小的不确定性也会导致合作行为，只要博弈重复的次数足够多（但不需要是无限次）；原因在于，如果博弈重复的次数足够长，没有任何一方愿意一开始就把自己的名声搞坏。 Grim Strategies 假定非理性型选择grim strategy; 如果A在一开始就选择背叛，暴露了自己是非合作型的，从第2期开始的唯一的均衡是每个人都背叛；所以A的最大预期收益为： 4+0+0+…=4; 假定选择如下战略：开始选择合作，直到对方选择不合作，之后永远背叛。最小预期收益是： p(3T)+(1-p)(-1+0+0+)=p(3T)-(1-p) 合作条件 (p)(3T)-(1-p)=4; T*=(5-p)/p; 所以，无论p多小，只要博弈重复的次数足够大，一开始就选择背叛不是最优的。 KMRW定理在不完全信息的情况下，只要博弈重复的次数足够长，参与人就有积极性在博弈的早期建立一个“合作”的声誉；只是在博弈的后期，才会选择背叛；并且，非合作阶段

您可能关注的文档

文档评论（0）

Ryanwh + 关注: 文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第7章不完全信息与声誉.pptVIP