网站大量收购独家精品文档,联系QQ:2885784924

四章重复博弈.docVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
四章重复博弈

第四章节 重复博弈 何为“重复博弈”? ?重复博弈是指基本博弈重复进行构成的博弈过程。 –重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈; –可信度:子博弈完美性仍是判断均衡是否稳定可靠的重要判断依据 4.1 引论 4.1.1 为什么研究重复博弈 4.1.2 基本概念 分类:有限次重复博弈,无限次重复博弈 给定一个基本博弈(可以静态,也可以动态),重复进行了次,并且在每次重复之前,各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“的次重复博弈”,记为。而称为的“原博弈”。中的每次重复称为的一个“阶段”。 理论上,重复博弈可以无限制进行下去,不一定经过一定次数重复以后就必须结束。如果一个基本博弈一直重复下去,这样的重复博弈就是“无限次重复博弈”,记为。无限次重复博弈的基本博弈也称为“原博弈”。 无限次重复博弈是有无限个阶段的动态博弈。 重复博弈的次数虽然有限,但重复的次数或博弈结束的时间不确定,这种重复博弈中博弈方的行为选择与确定结束时间的有限次重复博弈很不同,与无限次重复博弈很相似,甚至可以通过某种方式与无限次重复博弈统一起来。这种重复博弈可以称为“随机结束的重复博弈”。 策略、子博弈和均衡路径 ?策略: –博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何行动的计划。 ?子博弈: –重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。 ?路径: -–子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡分析及相关结论,可以推广到重复博弈中。 -–重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有种策略组合,那么重复两次就有条博弈路径,重复次就有条博弈路径。 重复博弈的得益(支付) 任何博弈中博弈方策略选择的依据都是得益的大小。 计算重复博弈的“总得益”。 计算各阶段的“平均得益”。 时间有先后,引入贴现系数 无限次重复博弈: 无限次重复博弈有时也写作 在考虑贴现因素的情况下,重复博弈的平均得益与不考虑贴现因素时的平均得益,必然也有所不同。通常可以用下列方式定义平均得益。 如果一常数作为重复博弈(有限次重复或无限次重复)各个阶段的得益,能产生与得益序列,,…相同的现值,则称为,,…的“平均得益”。 有限次重复博弈不一定考虑贴现问题。 无限次重复博弈必然要考虑贴现问题。由于无限次重复博弈每阶段得益都是时,现值为,而每阶段得益为,,…时,无限次重复博弈的得益现值是,因此令 = 这就是计算无限次重复博弈平均得益的公式。 随机停止和贴现率 典型的随机结束重复博弈可以理解为在进行一个重复博弈时,每次都通过抽签来决定是否停止重复,如果抽到停止重复的概率为,则抽到重复下去的概率为。 设某博弈方在此博弈中的阶段得益为,利率为,因为在每一次博弈以后能继续下一次重复的可能性是,因此第二阶段的期望得益为,进一步,第三阶段的期望得益为,… 故该博弈方在重复博弈中期望得益的现值为: 其中最后一个等式是通过令得到的。 把这个与前面纯粹考虑时间价值的贴现率统一起来,我们就把已知概率的随机停止重复博弈与无限次重复博弈统一起来了。随机停止重复博弈问题可以当作无限次重复博弈来进行分析。 4.2 有限次重复博弈 4.2.1 两人零和博弈的有限次重复博弈 重复零和博弈不会创造出新的利益。 合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈,也不会改变它们在当前阶段博弈中的行动方式,不可能变得(哪怕是暂时的)合作和顾及对方的利益。 所有以零和博弈为原博弈的有限次重复博弈,博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。 推广:非零和或多个博弈方,博弈方的利益严格对立,没有纯策略纳什均衡的其他严格竞争博弈中。在以这些博弈作为原博弈构成的有限次重复博弈中,惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略。 例:有限次重复猜硬币博弈 ?各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。 4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈 在有惟一纯策略纳什均衡的博弈中,博弈方之间的利益关系不再是始终对立的,而是有很大一致性甚至完全一致。 在以这样的博弈为原博弈的有限次重复博弈中,博弈方的行动和博弈结果会不会发生质的变化? 如果原博弈惟一的纯策略纳什均衡本身就是帕累托意义上的最佳策略组合,那么因为符合所有博弈方的利益,因此,有限次重复显然不会改变博弈方的行动方式。 分析:原博弈惟一的纳什均衡没有达到帕累托效率,因此存在通过合作进一步提高效率的潜在可能性的囚徒困境式的博弈,在有限次重复博弈中能不能实

文档评论(0)

asd522513656 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档