博弈论第4章多阶段可观察行动博弈的应用.pptVIP

博弈论第4章多阶段可观察行动博弈的应用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 多阶段可观察行动博弈的应用 1、有限期博弈的单阶段偏离原则 ——定理4.1 在多阶段可观察行动博弈中,策略组合s是子博弈完美的当且仅当它满足单阶段偏离条件,即没有一个参与人i可以通过在某一阶段偏离s策略而在其他阶段采取s的行动而获得好处。 ——更精确地说,策略组合s是子博弈完美当且仅当不存在参与人i和策略si,除了在时期t和历史行动ht下与策略si不同之外,且到达历史ht的策略si对s-i的反应比si更好。 ——证明:必要性,根据子博弈完美的定义可知,s必须满足单阶段偏离条件,即这一条件是必要条件。 ——充分性,反证法:假定策略组合s满足这满足这一条件,但并不是子博弈精练均衡。 ——存在一个阶段t和历史ht,使某个参与人i有一个策略si,其在ht开始的子博弈中对s-i的反应比si更好。令t表示满足如下条件的最大值t’:对于某个ht,si(ht’)≠si(ht’)。 ——单阶段背离条件暗含了tt,且因为博弈是有限的,t也是有限的。 ——考察另一种策略si’:当t t时,策略si与策略si’相同,当从t之后与si相同。 ——由于从t+1开始, 策略si与策略si是相同的,单阶段背离条件暗含了, si’与si在从开始的每一个子博弈中是一样好的反应。因此,si’与si在历史ht下从t开始的子博弈中是一样好的。 ——如果t=t+1,那么si’=si。这si与可以改进si的假设矛盾。 ——如果tt+1,那么我们构建一个直到t-2与策略si一样的策略,并证明它与策略si是一样好的反应,如此等等。 2、无限期博弈的单阶段偏离法则 重复博弈 1、重复博弈的定义 ——重复博弈是一类特殊的动态博弈,指同样结构的博弈重复多次,其中每一次博弈称为“阶段博弈”。 2、重复博弈的基本特征 ——阶段博弈之间没有“物质上”的联系,也就是说,前一阶段的博弈不改变后一阶段博弈的结构; ——所有参与人都观察到博弈过去的历史; ——参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。 3、囚徒困境的重复博弈 ——在一个重复博弈中,每期收益只依赖于当期行动。一个行动序列的标准化收益被称为“平均贴现收益”。例如从0期 到T期每期收益为1,其总的贴现值为(1-δT+1)/(1-δ),而这一收益流的平均贴现值为1; ——在囚徒困境中,如果双方进行一次博弈,那么唯一的均衡是两个参与人都选择背叛; ——如果双方只重复有限次,那么子博弈完美要求两个参与人在最后一期博弈时都选择背叛。根据逆向归纳法,唯一的完美子博弈均衡就是两个参与人在每一阶段都选择背叛; ——如果博弈进行无限多次,那么“每一阶段参与人都选择背叛”仍然是一个完美子博弈均衡,且是唯一一个参与人每期行动都与上期行动相同的均衡; ——然而,如果期限是无限的,且δ1,那么下面的策略组合也是完美子博弈均衡:“开始时选择合作,只要没有参与人背叛就一直合作,但只要有一个参与人背叛,在以后的博弈中,就一直背叛。” ——这一策略面临两类子博弈:A类是没有参与人背叛,B类是背叛从t开始就已经发生。 ——如果一个参与人在A类的每个子博弈都执行这一策略,那么他的平均贴现收益是1;但如果他在时间t偏离这一策略,并在此后(一直在B类子博弈中)一直背叛,那么他的标准收益是1-δt(2δ-1); ——当δ1/2时,显然其收益小于1。对于B类子博弈中的任何历史ht,从t往后一直奉行这一策略的收益是0,偏离一次后再奉行该策略,在t期收益为-1,在以后仍然是0; ——这样,在任何子博弈中,没有参与人可以从偏离一次后再奉行这一特定策略而获得好处,根据单阶段偏离条件,这一策略组合是一个完美子博弈均衡。 具有多个静态均衡的有限重复博弈 1、两期重复阶段博弈 ——如图4-2,如果博弈仅进行一次,那么将存在三个均衡:(M,L),(U,M),和一个混合策略均衡(3/7U,4/7M),(3/7L,4/7M),分别可以获得收益(4,3),(3,4),和(12/7,12/7))。 ——很显然,在一次博弈中,有效收益(5,5)不能作为一个均衡获得。然而,在一个两阶段博弈中,如果δ 7/9,那么下面的策略组合是一个完美子博弈均衡:在第一阶段选择策略组合(D,R)。如果第一阶段的结果是(D,R),那么在第二阶段选择(M,L);如果第一阶段的结果不是(D,R),那么在第二阶段使用混合策略均衡。 ——这一策略组合在第二阶段是一个纳什均衡,因为第一阶段的背离只会给当期的收益增加1,但是同时却使 参与人1和2的第二阶段收益分别从4或3降到12/7。 ——这样,只要1(4-12/7)δ或δ7/16,参与人1不会偏离。同时,只要1(3-12/7)δ或δ7/9 ,参与人2也不会采取偏离行动。 Rubinstein-Stahl议价模型 1、基本模型 ——问题:两个参与人分割一个大小

文档评论(0)

didala + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档