博弈课件PART6章节.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十节 扩展式博弈的 序贯均衡(2) 计算序贯均衡的一个例子 初步结论 前面例题说明,即使很小的初始怀疑,对于多阶段博弈中的理性参与人的行为可能会有重大影响。 如果参与人1对2的自私品行没有任何怀疑,那么不断自私是唯一的序贯均衡 但是,当参与人1对2的慷慨性情的判断即使只有很小的正概率(.05),即使参与人2本质上不是慷慨者,她仍然可能回报慷慨以鼓励参与人1对她未来会继续慷慨赋予较高的概率。 计算序贯均衡的另一个例子 考虑下图所示的博弈 借助于信息状态3的信念,参与人2的条件支付是 选择e3,为8α+0(1- α)= 8α 选择f3,为7α+7(1- α)=7 选择g3,为6α+9(1- α)=9-3 α 借助于信息状态3的信念,参与人2的条件支付是 选择e3,为8α+0(1- α)= 8α 选择f3,为7α+7(1- α)=7 选择g3,为6α+9(1- α)=9-3 α 因此,序贯均衡在信息状态3处的支撑只能是{e3},{f3},{g3},{e3,f3}及{f3,g3} 因此,序贯均衡在信息状态3处的支撑只能是{e3},{f3},{g3},{e3,f3}及{f3,g3} 如果2在状态3肯定使用e3,那么1在状态1会选择x1,而在状态2会选择x2,考虑到一致性要求,α=1/2;但若α=1/2,则e3对于3来说是非理性的行动(与g3比较)。因此,状态3处不存在支撑为{e3}的序贯均衡。 如果2在状态3肯定使用f3,那么1在状态1会选择y1,而在状态2会选择y2,由于结点2.3的先验概率为0,因此与([y1],[y2])的一致性不会对信念概率α进行限制。但是参与人2在信息状态3处的序贯理性要求2/3≤ α ≤7/8,否则她不会选择f3.因此,行为策略组合([y1],[y2],[f3])与任一满足2/3 ≤ α ≤7/8的信念向量一起,构成一个序贯均衡。 如果2在状态3肯定使用g3,那么1在状态1会选择x1,而在状态2会选择y2,从而与([x1],[y2])的一致性要求α=1。但在该种情形下,g3对于处于状态3的参与人2来说是一个非理性行动(与e3对比),因此,在状态3处不存在支撑为{g3}的序贯均衡。 为使e3与f3之间的随机化对处于状态3处的2来说是序贯理性的,信念概率α=7/8 存在两种方法构造序贯理性的局方案。方法1:在状态1选择y1,在状态2选择y2,于是结点2.3先验概率为0。为使这样的行动对于参与人1来说是理性的,e3的行动概率不能大于1/4。因此,对于满足0≤β ≤1/4的β,行为策略组合([y1],[y2], β[e3]+(1- β)[f3])与信念概率α=7/8,构成一个序贯均衡。 为使e3与f3之间的随机化对处于状态3处的2来说是序贯理性的,信念概率α=7/8 方法2,让参与人1在状态2处随机行动。当预期2在e3与f3之间随机化时,为使1在状态2乐意在x2与y2之间随机化,e3的行动概率必须等于2/3,相对于这一随机策略,参与人1在状态1肯定选择x1。若状态2处x2的行动概率为1/7,则α=7/8与局方案一致。因此,行为策略组合([x1],(1/7)[x2]+(6/7)[y2],(2/3)[e3]+(1/3)[f3])与信念概率α=7/8构成序贯均衡。 同样的分析过程,考虑到使参与人2乐于在f3与g3之间随机化,得到另外一个序贯均衡,为对于任意满足0 ≤γ ≤1/3的γ,行为策略组合([y1],[y2],(1- γ)[f3]+ γ[g3])与信念概率α=2/3一起,构成一个序贯均衡。 子博弈完美均衡 子博弈完美均衡由则而滕提出。 子博弈完美均衡概念比序贯均衡概念要陈旧和弱一些。 对于Γe中任一结点x,令F(x)为跟随x的所有结点和枝组成的集,包括x本身。,如果对于S中的每个s,Ys∩F(x)=φ与Ys包含于F(x)两者必居其一,则称结点x为一个子根。 Γe的子博弈由Γe按照这样的方式导出,首先剔除不跟随某个子根x的所有结点和所有枝,并以结点x作为此子博弈的根。 子博弈完美均衡(subgame-perfect equilibrium) 子博弈完美均衡定义 对于Γe的每一个子博弈, 对于Γe的一个行为策略均衡,将该行为策略限制在此子博弈中的行为策略也是此子博弈的一个行为策略均衡。 子博弈完美均衡 一个简单的房地产开发博弈 假定开发商A先决策,开发商B观测到A的选择后决策。 那么博弈的扩展式表述如右图表述。 子博弈完美均衡 该博弈有三个纯策略纳什均衡,分别为 (开发,{不开发,开发}) (开发,{不开发,不开发}) (不开发,{开发,开发}) 子博弈完美均衡 但只有如图红色路径所示的行为策略,才是子博弈完美均衡。 完美信息博弈 一个扩展式博弈中,如果所有参与人的每个信息状态都恰好只包含一个决策结点,称这样的扩展

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档