博弈论770160.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章重复博弈 重复博弈是指基本博弈重复进行构成的博弈过程 。这里并不是博弈的简单重复,因为博弈方在重复进行博弈的过程中,重复的意识会使他们对利益的判断发生变化。所以不是简单叠加,而是对重复博弈过程进行整体研究。一般是静态的重复,而重复本身是一个动态过程。 主要内容: 1.有限次重复博弈 2.无限次重复博弈 一、重复博弈引论 1.为什么要研究重复博弈? 现实中重复博弈具有普遍性。前面的静态或动态博弈都是反映社会经济活动中的一次性合作或竞争关系。但实际上还存在着更多的长期反复的合作竞争关系。如某一市场的两个竞争对手;两个企业的长期合作协议的遵守;商业中的回头客等都是重复博弈。 长期与短期并不是时间长短的差异。这里有本质区别。 短期关系中因为缺乏形成默契与合作,或者报复与制裁,不能形成共同追求利益的机会。而长期关系则不同,博弈方在考虑当前利益的同时,要兼顾未来利益,行为和结果都较为复杂。 因为是重复博弈,各阶段不像一般的动态博弈一样环环相扣,而是各阶段相互独立,后一阶段的选择受前面博弈过程的影响不大。比如回头客,每一次交易都是独立的博弈,每次交易对未来的影响是间接的。所以理解为重复博弈比理解为长期的动态博弈更符合实际情况。 2.基本概念 (1)设G是一个基本博弈(动静都可以,但一般研究静态),重复进行T次,并且每次重复之前各博弈方都能看到此前的博弈结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T),G称为G(T)的原博弈,每一次重复称为G(T)的一个阶段。 重复博弈的每一个阶段都是独立的博弈,各方都有得益。这是与一般动态博弈的重要不同。另一方面,重复博弈中各阶段的博弈方和博弈内容都必须相同,与一般的动态博弈也不同。 如果一个博弈有明确的结束时间,则这个博弈可以理解为有限次重复博弈,如果博弈可以一直进行下去,则称为无限次重复博弈,记为G(∞)。当然,任何人也不能无限的进行重复博弈,如果可以预见到博弈可以无限进行下去,就认为是无限次重复博弈。因为这时解决问题的思路和无限次重复博弈是一样的。 除了有明确的结束次数或时间的有限次重复博弈和无结束时间的无限次重复博弈以外,还有一种博弈,它的结束时间和次数是不确定的,我们称为随机结束的重复博弈。 (2)策略、子博弈、均衡路径 动态博弈中,博弈方的策略是指轮到行为时针对每一种可能情况选择完整的行动计划。而重复博弈在每一阶段各个博弈方都必须行为,因此一个策略就是在每一个阶段(即每一次重复)针对每一种情况(以前阶段的结果)如何行为的计划。 重复博弈是动态博弈,有阶段概念,因此也有子博弈概念。重复博弈的子博弈就是从某个阶段(不含第一阶段)开始,包括此后所有阶段的重复博弈过程。重复博弈的子博弈还是重复博弈(最后一个是原博弈)。与子博弈有关的概念和结论如子博弈完美纳什均衡、逆推归纳法等都可以推广到重复博弈中去。 动态博弈中各博弈方的策略组合对应一条路径,均衡策略组合对应一条均衡路径,这些路径有各个阶段的轮到行为的博弈方的行为依次连接而成。 重复博弈是动态博弈,也有路径概念。但重复博弈中每个博弈方在每个阶段都必须行为,因此重复博弈的路径是每个阶段的博弈方的行为组合串联而成。因为对应于前一阶段的每一种结果,下一阶段都有原博弈全部策略组合作为可能结果。比如说,原博弈有m个策略组合,重复一次就有m2个路径。重复博弈路径很多,使博弈有了更多的结果。分析重复博弈就是要分析具有稳定性的均衡路径,及其效率意义。 (3)重复博弈的得益 任何博弈中策略的选择依据都是得益的大小。但重复博弈与一次性博弈不同,不是博弈结束后有一个总的得益,而是每一个阶段都有得益。如果考虑各阶段的得益,重复博弈就成了多次单独的博弈,不是我们所说的重复博弈。因此,重复博弈不能只考虑现阶段,必须兼顾其他阶段,以及整个重复博弈的总得益。 考虑的方式可以是总得益,也可以是各阶段的平均得益。有时候平均得益更有实际意义。需要说明的是,无论总得益还是平均得益都在有限次的重复博弈中才能计算。 重复博弈的各阶段有时间次序,各阶段的得益也有时序。重复次数不多或时间间隔不长,得益的时序问题无关紧要,但若是次数较多,或时间较长,比如是无限阶段重复博弈,就必须考虑得益的时序问题。 一般是把各阶段的得益折合成现值来计算。若利率为r,则贴现系数为 则重复T次,各阶段的得益分别为a1,a2, …,aT时的总得益的现值就是 无限次重复博弈的总得益的现值就是 平均得益:如果一个常数A作为重复博弈的各个阶段的得益,能产生与得益序列a1,a2, …,aT相同的现在值,就称A为a1,a2, …,aT的平均得益。 如果不考虑贴现因素,可让贴现率为1,就可以同样适用上述定义。 在无限次重复博弈中,当每一阶段的得益都是A时,现在值就是因此令这就是计算平均得益

文档评论(0)

dreamclb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档