5 重复博弈和无名氏定理[精].pptVIP

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5 重复博弈和无名氏定理[精]

重复博弈和无名氏定理 动态博弈的另一种特殊但是非常重要的类型就是所谓的“重复博弈”。 顾名思义,重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈” 有限次重复博弈:连锁店悖论 考虑市场进入阻挠博弈 现在假定同样的市场有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就变成了20次重复博弈。假定进入者先进入第一个市场,在位者应该如何反应? 大家可能会猜想,尽管从一个市场上看,在位者的最优选择是默认,但因为现在有20个市场要保护,为了阻止进入者进入其他19个市场,在位者应该选择斗争。 在这个博弈中,在位者选择斗争的惟一原因是希望斗争能起到一种威摄力量,使进入者不敢进入。但在有限次重复博弈中,斗争并不是一个值得置信的威胁。 该博弈的惟一子博弈精炼均衡是:在位者在每一个市场上都选择默许,进入者在每一个市场上选择进入。 囚徒困境与市场进入阻挠博弈类似。只要博弈重复的次数是有限的,最后阶段的惟一纳什均衡就是两个囚徒都选择坦白;逆向归纳法意味着“总是坦白”是惟一的子博弈精炼均衡。 上述结果表明:只要博弈的重复次数是有限的,重复本身并不改变囚徒困境的结果。 无限次重复博弈和无名氏定理 当博弈重复无穷次而不是有限次时,存在着完全不同于一次博弈的子博弈精炼均衡。 考虑囚徒困境博弈,假定博弈重复无穷次。 考虑下列所谓的“冷酷战略”: (1)开始选择沉默;(2)选择沉默直到有一方选择坦白,然后永远选择坦白。 根据这个战略,一旦一个囚徒在某个阶段博弈中选择了坦白,之后他将永远选择坦白。 我们首先证明冷酷战略是一个纳什均衡。我们将证明不论囚徒j是否选择冷酷战略,冷酷战略始终是i的最优战略。 假定囚徒j选择上述冷酷战略,冷酷战略是不是囚徒i的最优战略呢? 令?为贴现因子(假定两人的贴现因子相同)。如果i在博弈的某个阶段首先选择了坦白,他在该阶段得到0单位的支付。但他的这种行为将触发囚徒j的“永远坦白”的惩罚,因此,i随后每个阶段的支付都是-6。因此如果给定下列条件满足,假设j没有选择坦白,i将不会选择坦白: 现在假定j首先选择了坦白,那么i是否有积极性坚持冷酷战略惩罚j的不合作行为呢? 假定j坚持冷酷战略,j一旦坦白将永远坦白;如果i坚持冷酷战略,他随后每阶段的支付是-6,但如果他选择任何其它战略,他在任何阶段的支付不会大于-6,因此不论?为多少,i有积极性坚持冷酷战略。类似的,假定j坚持冷酷战略,即使i自己首先选择了坦白,坚持冷酷战略也是最优的。 这样,我们就证明了冷酷战略是一个纳什均衡。接下来的任务是证明这个纳什均衡是一个子博弈精炼纳什均衡,即在每一个子博弈上构成纳什均衡。 因为博弈重复无限次,从任何一个阶段开始的子博弈与这个博弈的结构相同。 在冷酷战略纳什下,子博弈可以划分为两类:A类,没有任何人曾经坦白;B类,至少一人曾经坦白。我们已经证明,冷酷战略在A类子博弈中构成纳什均衡。在B类,根据冷酷战略,参与人只是重复单阶段博弈的纳什均衡,它自然也是整个子博弈的纳什均衡。 由此我们证明,如果?=1/6,冷酷战略是无限次重复博弈的一个子博弈精炼纳什均衡,帕雷托最优(沉默,沉默)是每一个阶段的均衡结果,囚徒走出了一次性博弈的困境。 实际上,也存在一些其它的战略使得当事人之间实现合作。 大众定理:存在无穷多对战略,可以成为无限次重复博弈的平衡点,并同时实现双方的合作。 其他的战略 恕道战略 恶棍战略 流氓战略 傻客战略 * * 0,300 0,300 不进入 -10,0 40,50 进入 进入者 斗争 默许 在位者 囚徒2的战略囚徒1的战略 沉默 招认 沉默 -1,-1 -9,0 招认 0,-9 -6,-6 或 解上述条件得: 也就是说,如果 ,给定j坚持冷酷战略并且j没有 首先坦白,i不会选择首先坦白。 *

文档评论(0)

dart002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档