博弈论-第4章多阶段可观察行动博弈应用.ppt

下载文档 降价啦

52
0
约5.15千字
约 20页
2017-07-23 发布于河南
举报
版权申诉
保障服务

博弈论-第4章多阶段可观察行动博弈应用.ppt

1、本文档共20页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论-第4章多阶段可观察行动博弈应用

第4章多阶段可观察行动博弈的应用;——存在一个阶段t和历史ht，使某个参与人i有一个策略si，其在ht开始的子博弈中对s-i的反应比si更好。令t表示满足如下条件的最大值t’：对于某个ht，si(ht’)≠si(ht’)。 ——单阶段背离条件暗含了tt，且因为博弈是有限的，t也是有限的。 ——考察另一种策略si’：当t t时，策略si与策略si’相同，当从t之后与si相同。 ——由于从t+1开始，策略si与策略si是相同的，单阶段背离条件暗含了， si’与si在从开始的每一个子博弈中是一样好的反应。因此，si’与si在历史ht下从t开始的子博弈中是一样好的。 ——如果t=t+1，那么si’=si。这si与可以改进si的假设矛盾。 ——如果tt+1，那么我们构建一个直到t-2与策略si一样的策略，并证明它与策略si是一样好的反应，如此等等。 2、无限期博弈的单阶段偏离法则;重复博弈;到T期每期收益为1，其总的贴现值为(1-δT+1)/(1-δ)，而这一收益流的平均贴现值为1； ——在囚徒困境中，如果双方进行一次博弈，那么唯一的均衡是两个参与人都选择背叛； ——如果双方只重复有限次，那么子博弈完美要求两个参与人在最后一期博弈时都选择背叛。根据逆向归纳法，唯一的完美子博弈均衡就是两个参与人在每一阶段都选择背叛； ——如果博弈进行无限多次，那么“每一阶段参与人都选择背叛”仍然是一个完美子博弈均衡，且是唯一一个参与人每期行动都与上期行动相同的均衡； ——然而，如果期限是无限的，且δ1，那么下面的策略组合也是完美子博弈均衡：“开始时选择合作，只要没有参与人背叛就一直合作，但只要有一个参与人背叛，在以后的博弈中，就一直背叛。”;——这一策略面临两类子博弈：A类是没有参与人背叛，B类是背叛从t开始就已经发生。 ——如果一个参与人在A类的每个子博弈都执行这一策略，那么他的平均贴现收益是1；但如果他在时间t偏离这一策略，并在此后（一直在B类子博弈中）一直背叛，那么他的标准收益是1-δt(2δ-1)； ——当δ1/2时，显然其收益小于1。对于B类子博弈中的任何历史ht，从t往后一直奉行这一策略的收益是0，偏离一次后再奉行该策略，在t期收益为-1，在以后仍然是0； ——这样，在任何子博弈中，没有参与人可以从偏离一次后再奉行这一特定策略而获得好处，根据单阶段偏离条件，这一策略组合是一个完美子博弈均衡。;具有多个静态均衡的有限重复博弈;参与人1和2的第二阶段收益分别从4或3降到12/7。 ——这样，只要1(4-12/7)δ或δ7/16，参与人1不会偏离。同时，只要1(3-12/7)δ或δ7/9 ，参与人2也不会采取偏离行动。;Rubinstein-Stahl议价模型;——这样，如果博弈在时期t结束，t是参与人i的提议阶段，参与人1的支付贴现值是Π1=δ1t-1xi，而参与人2的支付贴现值是Π2=δ2t-1(1-xi)。 2、有限期博弈 ——如果博弈的期限T是有限的，那么运用逆向归纳法可以求解子博弈精练纳什均衡。 ——T=2。在第2期，参与人2出价，x2=0；在第1期，1-x1≥δ2。子博弈精练均衡的结果是参与人1得到1-δ2，参与人2得到δ2。 ——T=3,4,5,…,∞ 3、子博弈精练均衡结果与贴现因子δ和期限T之间的关系 ——如果δ1=δ2 =0，即两个参与人是绝对无耐心的，那么不论T为多少，子博弈精练均衡结果是x=1，即提议人获得整个蛋糕；;——如果δ2 =0，不论δ1为多少，子博弈精练均衡结果仍然是是x=1； ——如果δ1 =0，δ20，那么结果是x=1-δ2； ——假定δ1=δ2 =1，如果T=1,3,5,…，那么均衡结果是x=1；如果T=2,4,6,…，那么均衡结果是x=0。这样，参与人具有“后动优势”； ——如果0δi1,i=1,2，那么均衡结果不仅依赖于贴现因子的相对比率，而且依赖于博弈期限长度T和谁在最后阶段出价。然而，这种依存关系随T的变大而变小； ——定理(Rubinstein,1982)：在无限期轮流出价博弈中，唯一的子博弈精练纳什均衡结果是：x*=(1-δ2)/(1-δ1δ2)。具体地，如果δ1=δ2 =δ，那么x*=1/(1+δ)； ——证明：当T=∞时，从参与人1出价的任何一个阶段开始的子博弈等价于从t=1开始的整个博弈。;——假定在时期t ≥ 3参与人1出价，参与人1能得到的最大份额是M。在t-1时期，参与人1得到δ1M，参与人2得到1-δ1M；在t-2时期，参与人2得到δ2(1-δ1M)，参与人1得到1-δ2(1-δ1M)； ——由于从t-2开始的博弈与从t开始的博弈完全相同，因此，参与人1在t-2期能获得的最大份额一定与其在t期得到的最大份额相同，即x1=M= 1-δ2(1-δ1M)。于是，有M= (1-δ2)/