扩展式可理性化答辩.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[102] 5扩展式可理性化 心灵有其莫明的理由。 Blaise Pascal 扩展式博弈中,参与人可以在博弈进程中收集信息更新其主观先验信念,故而其信息比标准式博弈丰富得多。由此,研究扩展式博弈中的可理性化比之相应的标准式博弈要复杂得多。有两种方法可用于剔除那些不会被理性的主体所选择的策略:逆向归纳法和前向归纳法。后者相对奇特(尽管更能自圆其说),将在第9章讨论。作为迄今最受欢迎的分析技巧,逆向归纳法使用反复剔除弱劣策略的办法,来获得子博弈完美纳什均衡——该均衡在所有的子博弈中都是纳什均衡。若扩展式博弈有唯一的子博弈完美纳什均衡,则我们就称之为一般的。 在本章中,我们提出形式逻辑工具并展示Robert Aumann关于CKR隐含着逆向归纳法的著名证明(Aumann,1995)。这一定理曾广遭批评,也广受误解。我想澄清其中的一些问题,这些问题对于当前的博弈理论至关重要。我的???论是,Aumann完全正确,真正的罪魁是CKR自身。 5.1逆向归纳法与劣策略 在完美信息(即每个信息集中只有一个节点)扩展式博弈中,逆向归纳法的操作步骤如下。选择任意终端节点τ∈T,并找到其父节点,即节点v。假设参与人i在节点v进行选择,并假设参与人i在节点v的最大赢利从终点节τ∈T获得。擦去从v点开始的所有枝,则v就成为一个终点,然后把τ的赢利绑定到新的终端节点v。[103]同时,记录下i在v点的行动,这样你就可以在分析完毕后刻画出i的均衡策略。对原博弈的所有终端节点重复上述程序,之后,你就会得到一个比原博弈少一级的扩展式博弈。好了,请不断重复上述过程。若最后的博弈树在每个节点都只有一个可能的行动,则当你把为每个参与人记录下的行动组合起来的时候,你就得到了一个纳什均衡。 由于我们是从博弈的终端节点向后推移的,故我们称此为逆向归纳法。请注意,当参与人在多个节点行动,逆向归纳将剔除弱劣策略,因而也就有可能剔除掉使用弱劣策略的纳什均衡。而且, 乍看起来,逆向归纳比标准式博弈的可理性化(§4.6)更强,后者等价于重复剔除严格劣策略。 图5.1 逆向归纳的一个例子 原书p103, Figure 5.1 考虑图5.1逆向归纳的一个例子。我们从标记为(0,0)的终端节点开始,回溯到左边的Bob节点。在该节点,由于10,故w劣于c,于是我们擦去Bob出招为w的枝及与其关联的赢利。我们再到原博弈树另一个终端节点(4,4),回溯到右边的Bob节点。在该节点,c劣于w,于是我们擦去劣势节点及其赢利。然后,我们将逆向归纳法运用到这个更小的博弈树上——当然,现在这已是再简单不过的了。我们找到第一个终点(9,1),它直接回溯到Alice的选择节点。[104]这里,c是劣的,于是我们擦去该枝及其赢利。于是就得到了解:Alice选择w,Bob选择cw,而赢利为(9,1)。 从这个例子可明显看到,利用逆向归纳法并剔除弱劣策略,我们剔除了纳什均衡c,ww。这是因为,我们假定Bob出招c去应对Alice的w,而剔除了Bob的弱劣策略ww和wc。我们称c,ww乃不可置信的威胁。逆向归纳法剔除了不可置信的威胁。 5.2子博弈完美 令v为扩展式博弈G的一个信息集,该信息集由单一节点构成。令H为包含有v的节点群的最小集合类,满足如下条件:当h∈H时,h的所有后续节点皆属于H,且与h位于同一信息集的所有节点皆属于H。我们把从博弈G继承而来的信息结构、枝以及赢利赋予给H,而H中的参与人正好是博弈G中在H的某些信息集上行动的参与人子集。显然,H乃一扩展式博弈,我们称H为G的子博弈。 若H是博弈G的子博弈,该子博弈以v为根节点,那么G的每一个到达v的纯策略组合都会在H中有一个副本sH,规定H中的参与人运用sH在H的每个节点上做出的选择要与其运用sG在G的每个同样的节点上做出的选择相同。我们称sH是sG对子博弈H的约束。假设σG=α1s1+…+αksk(Σiαi=1 )是到达H的根节点v的一个混合策略;并令I?{1,…,k}为指标集,满足当且仅当si到达h时有i∈I。令α=Σi∈Iαi 。那么,σH=Σi∈I(αi/α)si 就是定义于H上的混合策略,即所谓的σG对H的约束。由于σG会到达v,故α0,而系数αi/α 代表的是在到达h的条件下出招为si的概率。 很明显,若sG是博弈G的纯策略纳什均衡,而H是G的子博弈且H的根节点可由sG达到,那么sG对H的约束sH必定是H中的纳什均衡。然而,如果sG不能到达H的根节点,那么sG对H的约束就不一定是H中的纳什均衡。原因在于,若某个节点不能由sG达到,那么在该节点进行选择的参与人之赢利就并不取决于其在G中的选择,但它却会依赖于他在H中的选择。当一个扩展式博弈对每个子博弈的约束都是子博弈的纳什均衡时,我们才说该扩展式博弈的纳什均衡是子博弈完美的。[105] 容易

文档评论(0)

***** + 关注
实名认证
文档贡献者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档