博弈论第4章多阶段可观察行动博弈的应用.pptVIP

下载本文档

39
0
约6.55千字
约 20页
2016-12-16 发布于重庆
举报
版权申诉

博弈论第4章多阶段可观察行动博弈的应用.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第4章多阶段可观察行动博弈的应用 1、有限期博弈的单阶段偏离原则 ——定理4.1 在多阶段可观察行动博弈中，策略组合s是子博弈完美的当且仅当它满足单阶段偏离条件，即没有一个参与人i可以通过在某一阶段偏离s策略而在其他阶段采取s的行动而获得好处。 ——更精确地说，策略组合s是子博弈完美当且仅当不存在参与人i和策略si，除了在时期t和历史行动ht下与策略si不同之外，且到达历史ht的策略si对s-i的反应比si更好。 ——证明：必要性，根据子博弈完美的定义可知，s必须满足单阶段偏离条件，即这一条件是必要条件。 ——充分性，反证法：假定策略组合s满足这满足这一条件，但并不是子博弈精练均衡。 ——存在一个阶段t和历史ht，使某个参与人i有一个策略si，其在ht开始的子博弈中对s-i的反应比si更好。令t表示满足如下条件的最大值t’：对于某个ht，si(ht’)≠si(ht’)。 ——单阶段背离条件暗含了tt，且因为博弈是有限的，t也是有限的。 ——考察另一种策略si’：当t t时，策略si与策略si’相同，当从t之后与si相同。 ——由于从t+1开始，策略si与策略si是相同的，单阶段背离条件暗含了， si’与si在从开始的每一个子博弈中是一样好的反应。因此，si’与si在历史ht下从t开始的子博弈中是一样好的。 ——如果t=t+1，那么si’=si。这si与可以改进si的假设矛盾。 ——如果tt+1，那么我们构建一个直到t-2与策略si一样的策略，并证明它与策略si是一样好的反应，如此等等。 2、无限期博弈的单阶段偏离法则重复博弈 1、重复博弈的定义 ——重复博弈是一类特殊的动态博弈，指同样结构的博弈重复多次，其中每一次博弈称为“阶段博弈”。 2、重复博弈的基本特征 ——阶段博弈之间没有“物质上”的联系，也就是说，前一阶段的博弈不改变后一阶段博弈的结构； ——所有参与人都观察到博弈过去的历史； ——参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。 3、囚徒困境的重复博弈 ——在一个重复博弈中，每期收益只依赖于当期行动。一个行动序列的标准化收益被称为“平均贴现收益”。例如从0期到T期每期收益为1，其总的贴现值为(1-δT+1)/(1-δ)，而这一收益流的平均贴现值为1； ——在囚徒困境中，如果双方进行一次博弈，那么唯一的均衡是两个参与人都选择背叛； ——如果双方只重复有限次，那么子博弈完美要求两个参与人在最后一期博弈时都选择背叛。根据逆向归纳法，唯一的完美子博弈均衡就是两个参与人在每一阶段都选择背叛； ——如果博弈进行无限多次，那么“每一阶段参与人都选择背叛”仍然是一个完美子博弈均衡，且是唯一一个参与人每期行动都与上期行动相同的均衡； ——然而，如果期限是无限的，且δ1，那么下面的策略组合也是完美子博弈均衡：“开始时选择合作，只要没有参与人背叛就一直合作，但只要有一个参与人背叛，在以后的博弈中，就一直背叛。” ——这一策略面临两类子博弈：A类是没有参与人背叛，B类是背叛从t开始就已经发生。 ——如果一个参与人在A类的每个子博弈都执行这一策略，那么他的平均贴现收益是1；但如果他在时间t偏离这一策略，并在此后（一直在B类子博弈中）一直背叛，那么他的标准收益是1-δt(2δ-1)； ——当δ1/2时，显然其收益小于1。对于B类子博弈中的任何历史ht，从t往后一直奉行这一策略的收益是0，偏离一次后再奉行该策略，在t期收益为-1，在以后仍然是0； ——这样，在任何子博弈中，没有参与人可以从偏离一次后再奉行这一特定策略而获得好处，根据单阶段偏离条件，这一策略组合是一个完美子博弈均衡。具有多个静态均衡的有限重复博弈 1、两期重复阶段博弈 ——如图4-2，如果博弈仅进行一次，那么将存在三个均衡：(M,L)，(U,M)，和一个混合策略均衡(3/7U,4/7M)，(3/7L,4/7M)，分别可以获得收益(4,3)，(3,4)，和(12/7,12/7))。 ——很显然，在一次博弈中，有效收益(5,5)不能作为一个均衡获得。然而，在一个两阶段博弈中，如果δ 7/9，那么下面的策略组合是一个完美子博弈均衡：在第一阶段选择策略组合(D,R)。如果第一阶段的结果是(D,R)，那么在第二阶段选择(M,L)；如果第一阶段的结果不是(D,R)，那么在第二阶段使用混合策略均衡。 ——这一策略组合在第二阶段是一个纳什均衡，因为第一阶段的背离只会给当期的收益增加1，但是同时却使参与人1和2的第二阶段收益分别从4或3降到12/7。 ——这样，只要1(4-12/7)δ或δ7/16，参与人1不会偏离。同时，只要1(3-12/7)δ或δ7/9 ，参与人2也不会采取偏离行动。 Rubinstein-Stahl议价模型 1、基本模型 ——问题：两个参与人分割一个大小