第6章 重复博弈与信誉.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章 重复博弈与合作行为 张维迎 教授 北京大学光华管理学院 序惯博弈与重复博弈 序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次; 重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game). 重复博弈的三个特征 阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构; 所有参与人观察到博弈过去的历史; 参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和; 重复博弈和信誉问题 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。 囚徒困境博弈 重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例: All-D: 不论过去什么发生,总是选择不合作; All-C: 不论过去什么发生,总是选择合作; 合作-不合作交替进行; tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动; trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。 支付函数 双方都不合作: 对 的解释: 贴现率; 博弈继续的概率; 二者的结合; 一般化:未来收益的重要程度 无名氏定理(Folk Theorem) 在无限次重复博弈中,如果参与人对未来足够重视( 足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。 这里“合作程度”定义为整个博弈中合作出现的频率。 50年代就人所共知,但无人有发明权; Tit-for-tat 纳什均衡,但不是精炼纳什均衡: Why Not A Perfect NE 假定A在t=5的时候,没有合作。根据TFT战略,在t=6,B应该选择惩罚(不合作)。B会这样吗? 如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为: 反之,如果B原谅A, Trigger strategies 如果未来足够重要,精炼纳什均衡: 合作的条件 如果下列条件满足,合作就是均衡结果: 解释 R-T可以理解为不合作的诱惑; R-P是合作的剩余(利益); 条件说明: 给定未来的重要程度,不合作的一次性诱惑(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大; 给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大; 行为的信息传递 假如欺骗两次才被发现: 含义 欺骗行为越难以被发现,欺骗发生的可能性越大;或者说,合作越困难; 在前面的例子,R=4, T=3, P=0. 如果欺骗一次就被发现,只要 合作就会出现;而如果欺骗两次才被发现,只有当 时,合作才可能出现; 一般地,欺骗行为越不容易被发现,合作越困难。 惩罚与合作 Abreu(1986):最大合作战略是使用最严厉的可信惩罚(the strongest credible punishment); 维护合作并不需要无限期的惩罚;只要惩罚期足够长就可以了; 萝卜加大棒(stick and carrot): 从合作开始,一直合作直到:如果有任何一方在t期不合作,在t+1期,前期合作者选择“不合作”来实施惩罚,前期不合作者选择合作;如果该合作的没有合作或者该惩罚的没有惩罚,在t+2期继续按照上述t+1期的战略规定博弈;否则,合作恢复。 解释 在合作子博弈,合作的条件是: 在非惩罚子博弈,合作的条件是: 不可信的惩罚:垄断厂家 不确定性下的最优处罚 在确定的情况下,惩罚越严厉,越有助于合作。因为均衡情况下,欺骗从来不会发生,所以惩罚实际上是没有成本的。 但在不确定的情况下,即使每个人都选择合作,“坏结果”也会出现。如果坏结果总是触发惩罚,就会冤枉好人,过重的惩罚反到导致不合作;但如果总是原谅,合作也不会发生。 多重交易关系与合作行为 合作条件 在交易关系I中,合作要求 在交易关系II中,合作要求 如果两种交易在同样的两个人之间进行,只要 , ,

文档评论(0)

Ryanwh + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档