博弈论-第4章多阶段可观察行动博弈应用.ppt

博弈论-第4章多阶段可观察行动博弈应用.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论-第4章多阶段可观察行动博弈应用

第4章 多阶段可观察行动博弈的应用;——存在一个阶段t和历史ht,使某个参与人i有一个策略si,其在ht开始的子博弈中对s-i的反应比si更好。令t表示满足如下条件的最大值t’:对于某个ht,si(ht’)≠si(ht’)。 ——单阶段背离条件暗含了tt,且因为博弈是有限的,t也是有限的。 ——考察另一种策略si’:当t t时,策略si与策略si’相同,当从t之后与si相同。 ——由于从t+1开始, 策略si与策略si是相同的,单阶段背离条件暗含了, si’与si在从开始的每一个子博弈中是一样好的反应。因此,si’与si在历史ht下从t开始的子博弈中是一样好的。 ——如果t=t+1,那么si’=si。这si与可以改进si的假设矛盾。 ——如果tt+1,那么我们构建一个直到t-2与策略si一样的策略,并证明它与策略si是一样好的反应,如此等等。 2、无限期博弈的单阶段偏离法则;重复博弈;到T期每期收益为1,其总的贴现值为(1-δT+1)/(1-δ),而这一收益流的平均贴现值为1; ——在囚徒困境中,如果双方进行一次博弈,那么唯一的均衡是两个参与人都选择背叛; ——如果双方只重复有限次,那么子博弈完美要求两个参与人在最后一期博弈时都选择背叛。根据逆向归纳法,唯一的完美子博弈均衡就是两个参与人在每一阶段都选择背叛; ——如果博弈进行无限多次,那么“每一阶段参与人都选择背叛”仍然是一个完美子博弈均衡,且是唯一一个参与人每期行动都与上期行动相同的均衡; ——然而,如果期限是无限的,且δ1,那么下面的策略组合也是完美子博弈均衡:“开始时选择合作,只要没有参与人背叛就一直合作,但只要有一个参与人背叛,在以后的博弈中,就一直背叛。”;——这一策略面临两类子博弈:A类是没有参与人背叛,B类是背叛从t开始就已经发生。 ——如果一个参与人在A类的每个子博弈都执行这一策略,那么他的平均贴现收益是1;但如果他在时间t偏离这一策略,并在此后(一直在B类子博弈中)一直背叛,那么他的标准收益是1-δt(2δ-1); ——当δ1/2时,显然其收益小于1。对于B类子博弈中的任何历史ht,从t往后一直奉行这一策略的收益是0,偏离一次后再奉行该策略,在t期收益为-1,在以后仍然是0; ——这样,在任何子博弈中,没有参与人可以从偏离一次后再奉行这一特定策略而获得好处,根据单阶段偏离条件,这一策略组合是一个完美子博弈均衡。;具有多个静态均衡的有限重复博弈;参与人1和2的第二阶段收益分别从4或3降到12/7。 ——这样,只要1(4-12/7)δ或δ7/16,参与人1不会偏离。同时,只要1(3-12/7)δ或δ7/9 ,参与人2也不会采取偏离行动。;Rubinstein-Stahl议价模型;——这样,如果博弈在时期t结束,t是参与人i的提议阶段,参与人1的支付贴现值是Π1=δ1t-1xi,而参与人2的支付贴现值是Π2=δ2t-1(1-xi)。 2、有限期博弈 ——如果博弈的期限T是有限的,那么运用逆向归纳法可以求解子博弈精练纳什均衡。 ——T=2。在第2期,参与人2出价,x2=0;在第1期,1-x1≥δ2。子博弈精练均衡的结果是参与人1得到1-δ2,参与人2得到δ2。 ——T=3,4,5,…,∞ 3、子博弈精练均衡结果与贴现因子δ和期限T之间的关系 ——如果δ1=δ2 =0,即两个参与人是绝对无耐心的,那么不论T为多少,子博弈精练均衡结果是x=1,即提议人获得整个蛋糕;;——如果δ2 =0,不论δ1为多少 ,子博弈精练均衡结果仍然是是x=1; ——如果δ1 =0,δ20,那么结果是x=1-δ2; ——假定δ1=δ2 =1,如果T=1,3,5,…,那么均衡结果是x=1;如果T=2,4,6,…,那么均衡结果是x=0。这样,参与人具有“后动优势”; ——如果0δi1,i=1,2,那么均衡结果不仅依赖于贴现因子的相对比率,而且依赖于博弈期限长度T和谁在最后阶段出价。然而,这种依存关系随T的变大而变小; ——定理(Rubinstein,1982):在无限期轮流出价博弈中,唯一的子博弈精练纳什均衡结果是:x*=(1-δ2)/(1-δ1δ2)。具体地,如果δ1=δ2 =δ,那么x*=1/(1+δ); ——证明:当T=∞时,从参与人1出价的任何一个阶段开始的子博弈等价于从t=1开始的整个博弈。;——假定在时期t ≥ 3参与人1出价,参与人1能得到的最大份额是M。在t-1时期,参与人1得到δ1M,参与人2得到1-δ1M;在t-2时期,参与人2得到δ2(1-δ1M),参与人1得到1-δ2(1-δ1M); ——由于从t-2开始的博弈与从t开始的博弈完全相同,因此,参与人1在t-2期能获得的最大份额一定与其在t期得到的最大份额相同,即x1=M= 1-δ2(1-δ1M)。于是,有M= (1-δ2)/

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档