第7章 不完全信息与声誉.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章 不完全信息与声誉 张维迎 教授 北京大学光华管理学院 有限次博弈 第6章证明,只要未来足够重要,合作行为可以是无限次重复博弈的精炼纳什均衡。 但是,现实中许多博弈是有限次的,不是无限次的。 如果博弈重复的次数是有限的,无论重复多少次,合作都不会出现。 “连锁店悖论”(chain-store paradox) Selten (1978); 逆向归纳 假定在位者有20个市场。直观告诉我们,如果进入者在第一个市场进入,在位者应该选择斗争,因为尽管从一个市场看,斗争是不值得的,但这样做可以遏止进入者在其他市场上的进入。 唯一的精炼纳什均衡是:进入者总是进入;在位者总是默许。 问题在哪里? 一个可能的原因在于:我们前面假定不仅参与人的理性是共同知识,而且每个参与人可以选择的战略和效用函数都是共同知识。但现实不是这样。 可能性:逆向归纳方法的问题(理性共识);信息不完全; 正如我们前面讨论的谈判情况:如果信息是完全的,谈判一开始就达成协议,但现实中的谈判不是这样,原因在于信息不对称。 不完全信息 KMRW模型(1982); 如果参与人对其他参与人的效用函数和战略空间的信息不完全,即使博弈重复的次数是有限的,人们也有积极性建立一个合作的声誉(reputation),合作会出现。 单方不完全信息 假定有两个参与人,A和B,进行囚徒困境博弈。如下图。 参与人A有两中可能的类型:“非理性”型:只有一种战略,tit-for-tat (TFT),或者grim strategy, 概率为p; “理性”型:可以选择任何战略,概率为(1-p); 参与人B有一种类型:理性型。 对“非理性”的解释 特殊的成本函数或效用函数; 讲义气、重情谊的人;内在化了 reciprocity 社会规范的人; 认知问题; 博弈重复两次 第2阶段 参与人A:如果是理性的,选择“背叛”;如果是非理性的,选择B在第1阶段的行动(X); 参与人B:选择“背叛”。 第1阶段 参与人A:如果是非理性的,选择“合作”;如果是理性的,选择“背叛”; 参与人B:如果选择合作,面临被背叛的风险,但如果A是非理性的,可以换来第2阶段的合作。 B在第2阶段的选择 选择合作,期望效用是: 3p+(-1)(1-p)+4p+0(1-p)=8p-1 如果选择背叛,期望效用函数是: 4p+0(1-p)+0=4p 最优选择是合作,如果:p=0.25; 结论:如果B认为A非理性的概率不小于0.25, B在第1阶段会选择合作,即使博弈只重复两次。 博弈重复3次 参与人A(理性)的选择 如果A是理性的,在第2阶段和第3阶段一定会选择背叛,但第1阶段也可能选择合作,因为建立一个合作的形象可以换取B在第2阶段的合作; 如果p=0.25, 并且A认为B在第1阶段会合作,给定A在第2阶段合作的话B在在第2阶段也会合作,那么A选择合作得到:3+4+0=5; 如果A选择背叛,得到:4+0+0=4; 所以合作是最优的。 参与人B的选择 B有四种战略: (合作,合作,背叛); (合作,背叛,背叛); (背叛,背叛,背叛); (背叛,合作,背叛) 结论 只要p=0.25, 下表所列战略组合是一个精炼纳什均衡: 理性型A在第1阶段选择合作,然后在第2和第3阶段选择背叛; B在第1和第2阶段选择合作,然后在第3阶段背叛。 一般结论 可以证明:如果博弈重复T次,只要p=0.25, 对于所有的T=3, 下列战略组合构成一个精炼纳什均衡:理性型A在t=1….T-2阶段选择合作,在T-1和T阶段选择背叛;B在t=1….T-1阶段选择合作,在最后阶段T选择背叛。 背叛只在最后两阶段出现。 双方不完全信息 在单方不完全信息下,只要p0.25,不论博弈重复多少次,合作都不会出现。 但如果双方信息不完全,即使小小的不确定性也会导致合作行为,只要博弈重复的次数足够多(但不需要是无限次); 原因在于,如果博弈重复的次数足够长,没有任何一方愿意一开始就把自己的名声搞坏。 Grim Strategies 假定非理性型选择grim strategy; 如果A在一开始就选择背叛,暴露了自己是非合作型的,从第2期开始的唯一的均衡是每个人都背叛;所以A的最大预期收益为: 4+0+0+…=4; 假定选择如下战略:开始选择合作,直到对方选择不合作,之后永远背叛。最小预期收益是: p(3T)+(1-p)(-1+0+0+)=p(3T)-(1-p) 合作条件 (p)(3T)-(1-p)=4; T*=(5-p)/p; 所以,无论p多小,只要博弈重复的次数足够大,一开始就选择背叛不是最优的。 KMRW定理 在不完全信息的情况下,只要博弈重复的次数足够长,参与人就有积极性在博弈的早期建立一个“合作”的声誉;只是在博弈的后期,才会选择背叛;并且,非合作阶段

文档评论(0)

Ryanwh + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档