7 重复博弈:对称信息.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
重复博弈和信誉问题 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。 囚徒困境博弈 重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例: All-D: 不论过去什么发生,总是选择不合作; All-C: 不论过去什么发生,总是选择合作; 合作-不合作交替进行; tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动; trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。 支付函数 双方都不合作: 对 的解释: 贴现率; 博弈继续的概率; 二者的结合; 一般化:未来收益的重要程度 Tit-for-tat 纳什均衡,但不是精炼纳什均衡: Why Not A Perfect NE 假定A在t=5的时候,没有合作。根据TFT战略,在t=6,B应该选择惩罚(不合作)。B会这样吗? 如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为: 反之,如果B原谅A, Trigger strategies 如果未来足够重要,精炼纳什均衡: 合作的条件 如果下列条件满足,合作就是均衡结果: 解释 R-T可以理解为不合作的诱惑; R-P是合作的剩余(利益); 条件说明: 给定未来的重要程度,不合作的一次性诱惑(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大; 给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大; 行为的信息传递 假如欺骗两次才被发现: 含义 欺骗行为越难以被发现,欺骗发生的可能性越大;或者说,合作越困难; 在前面的例子,R=4, T=3, P=0. 如果欺骗一次就被发现,只要?δ ≥ 0.25 ,合作就会出现;而如果欺骗两次才被发现,只有当 δ ≥ 0.5 时,合作才可能出现; 一般地,欺骗行为越不容易被发现,合作越困难。 惩罚与合作 Abreu(1986):最大合作战略是使用最严厉的可信惩罚(the strongest credible punishment); 维护合作并不需要无限期的惩罚;只要惩罚期足够长就可以了; 萝卜加大棒(stick and carrot): 从合作开始,一直合作直到:如果有任何一方在t期不合作,在t+1期,前期合作者选择“不合作”来实施惩罚,前期不合作者选择合作;如果该合作的没有合作或者该惩罚的没有惩罚,在t+2期继续按照上述t+1期的战略规定博弈;否则,合作恢复。 解释 在合作子博弈,合作的条件是: 在非惩罚子博弈,合作的条件是: 不可信的惩罚:垄断厂家 不确定性下的最优处罚 在确定的情况下,惩罚越严厉,越有助于合作。因为均衡情况下,欺骗从来不会发生,所以惩罚实际上是没有成本的。 但在不确定的情况下,即使每个人都选择合作,“坏结果”也会出现。如果坏结果总是触发惩罚,就会冤枉好人,过重的惩罚反到导致不合作;但如果总是原谅,合作也不会发生。 多重交易关系与合作行为 合作条件 在交易关系I中,合作要求?δ ≥ 0.25 在交易关系II中,合作要求?δ ≥ 0.8 如果两种交易在同样的两个人之间进行,只要?δ ≥ 0.25 ,两 种交易中都会合作; 设想实际的 δ = 0 .6 ,那么如果两种交易发生在不同的人之间,合作只出现在市场I,不会出现于市场II。但如果两人之间同时存在两种交易,合作存在于两个市场。 社会关系与合作行为 更一般地讲,市场交易常常镶嵌在复杂的社会关系中。这种关系可以提高交易的合作程度。这也是人们愿意发展社会关系的原因。 举例 在交易关系II中,假定除了这一交易外,当事人双方之间还存在另外的社会关系,这一社会关系对每一方的现值是V。如果交易中出现欺骗,这一价值就不存在。合作条件为: 应用 家庭血缘关系; 朋友关系; 同学关系; 老乡关系(保姆市场); 家族企业的困境;“杀熟” 如果惩罚对惩罚者本身的损害太大,惩罚就是不可信的。这与投鼠忌器是一个道理,你讨厌老鼠,但是你没有办法,因为你心疼那个盘子,那个器皿。投鼠忌器在我们企业内部很多环节都会发生,导致惩罚不可信,所以对方就不会太注重信誉。家族成员有时候比非家族成员更不可信任,更不守规矩,就是这个道理。 朋友专门骗朋友,是“杀熟”。问题也与惩罚的不可信有关。 第三方实施的惩罚 前面假定了固定的一对参与人进行重复博弈,对不合作的惩罚是由“受害人”本人实施的,称为“sec

您可能关注的文档

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档