唯一纯策略纳什均衡博弈的有限次重复博弈.docxVIP

唯一纯策略纳什均衡博弈的有限次重复博弈.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
唯一纯策略纳什均衡博弈的有限次重复博弈 首先容易理解的是,如果原博弈的唯一的纯策略纳什均衡本身就是帕累托效率意义上的最优策略组合,那么因为符合所有博弈方的利益,因此有限次重复显然不会改变博弈方的行动方式。我们最关心的当然不是这种博弈,而是原博弈唯一的纳什均衡没有到达帕累托效率,因此存在通过合作进一步提高效率的潜在可能性的囚徒困境式博弈,在有限次重复博弈中能不能实现合作和提高效率的问题。 1.有限次重复囚徒困境博弈 下列图所示的是囚徒困境博弈,考虑两次重复该博弈。 我们用逆推归纳法来分析该重复博弈,先分析第二阶段,也就是第一次重复时两博弈方的选择。这个第二阶段仍然是一个囚徒困境博弈,此时前一阶段的结果已是既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的唯一原则。因此我们不难得出结论,不管前一次博弈的结果如何,第二阶段的唯一结果就是原博弈唯一的纳什均衡(坦白,坦白),双方得益(-5,-5)。 现在再回到第一阶段,即第一次博弈。理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二个阶段的结果必然是(坦白,坦白),双方得到(-5,-5)。因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最终得益,都将是在第一阶段得益的根底上各加-5。因此从第一阶段的选择来看,这个重复博弈与下列图中得益矩阵表示的一次性博弈实际上是完全等价的。该等价博弈仍然有唯一的纯策略纳什均衡(坦白,坦白),双方的得益则为(-10,-10)。这意味着两次重复的囚徒困境博弈的第一阶段结果与一次性博弈也一样,最终两次重复囚徒困境博弈仍然相当于一次性囚徒困境博弈的简单重复。根据上述分析方法,我们同样可以证明3次、4次,或者n次重复囚徒困境博弈的结果都是一样的,那就是每次重复都采用原博弈唯一的纯策略纳什均衡,这就是这种重复博弈唯一的子博弈完美纳什均衡路径。 2.一般结论 事实上,上述结果是具有一般意义的。原博弈有唯一的纯策略纳什均衡,则有限次重复博弈的唯一均衡即各博弈方在每阶段(即每次重复)中都采用原博弈的纳什均衡策略。 定理:设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有唯一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。 3.重复囚徒困境悖论和连锁店悖论 在重复的囚徒困境博弈的大量实验研究中,重复次数较大时的实验结果通常与上述理论结论不同,包含合作的情况非常普遍。其实,有限次重复的囚徒困境博弈的问题,与动态博弈中的蜈蚣博弈都是相似的,问题的症结都在于,在较多阶段的动态博弈中逆推归纳法的适用性受到了怀疑。

文档评论(0)

meifangfei2022 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体天津美芳菲科技有限公司
IP属地天津
统一社会信用代码/组织机构代码
91120116MA7HQE8142

1亿VIP精品文档

相关文档