扩展式可理性化答辩.docxVIP

下载本文档

8
0
约1.43万字
约 14页
2017-04-23 发布于湖北
举报
版权申诉

扩展式可理性化答辩.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

[102] 5扩展式可理性化心灵有其莫明的理由。 Blaise Pascal 扩展式博弈中，参与人可以在博弈进程中收集信息更新其主观先验信念，故而其信息比标准式博弈丰富得多。由此，研究扩展式博弈中的可理性化比之相应的标准式博弈要复杂得多。有两种方法可用于剔除那些不会被理性的主体所选择的策略：逆向归纳法和前向归纳法。后者相对奇特(尽管更能自圆其说)，将在第9章讨论。作为迄今最受欢迎的分析技巧，逆向归纳法使用反复剔除弱劣策略的办法，来获得子博弈完美纳什均衡——该均衡在所有的子博弈中都是纳什均衡。若扩展式博弈有唯一的子博弈完美纳什均衡，则我们就称之为一般的。在本章中，我们提出形式逻辑工具并展示Robert Aumann关于CKR隐含着逆向归纳法的著名证明(Aumann,1995)。这一定理曾广遭批评，也广受误解。我想澄清其中的一些问题，这些问题对于当前的博弈理论至关重要。我的???论是，Aumann完全正确，真正的罪魁是CKR自身。 5.1逆向归纳法与劣策略在完美信息(即每个信息集中只有一个节点)扩展式博弈中，逆向归纳法的操作步骤如下。选择任意终端节点τ∈T，并找到其父节点，即节点v。假设参与人i在节点v进行选择，并假设参与人i在节点v的最大赢利从终点节τ∈T获得。擦去从v点开始的所有枝，则v就成为一个终点，然后把τ的赢利绑定到新的终端节点v。[103]同时，记录下i在v点的行动，这样你就可以在分析完毕后刻画出i的均衡策略。对原博弈的所有终端节点重复上述程序，之后，你就会得到一个比原博弈少一级的扩展式博弈。好了，请不断重复上述过程。若最后的博弈树在每个节点都只有一个可能的行动，则当你把为每个参与人记录下的行动组合起来的时候，你就得到了一个纳什均衡。由于我们是从博弈的终端节点向后推移的，故我们称此为逆向归纳法。请注意，当参与人在多个节点行动，逆向归纳将剔除弱劣策略，因而也就有可能剔除掉使用弱劣策略的纳什均衡。而且, 乍看起来，逆向归纳比标准式博弈的可理性化(§4.6)更强，后者等价于重复剔除严格劣策略。图5.1 逆向归纳的一个例子原书p103, Figure 5.1 考虑图5.1逆向归纳的一个例子。我们从标记为(0,0)的终端节点开始，回溯到左边的Bob节点。在该节点，由于10，故w劣于c，于是我们擦去Bob出招为w的枝及与其关联的赢利。我们再到原博弈树另一个终端节点(4,4)，回溯到右边的Bob节点。在该节点，c劣于w，于是我们擦去劣势节点及其赢利。然后，我们将逆向归纳法运用到这个更小的博弈树上——当然，现在这已是再简单不过的了。我们找到第一个终点(9,1)，它直接回溯到Alice的选择节点。[104]这里，c是劣的，于是我们擦去该枝及其赢利。于是就得到了解：Alice选择w，Bob选择cw，而赢利为(9,1)。从这个例子可明显看到，利用逆向归纳法并剔除弱劣策略，我们剔除了纳什均衡c,ww。这是因为，我们假定Bob出招c去应对Alice的w，而剔除了Bob的弱劣策略ww和wc。我们称c,ww乃不可置信的威胁。逆向归纳法剔除了不可置信的威胁。 5.2子博弈完美令v为扩展式博弈G的一个信息集，该信息集由单一节点构成。令H为包含有v的节点群的最小集合类，满足如下条件：当h∈H时，h的所有后续节点皆属于H，且与h位于同一信息集的所有节点皆属于H。我们把从博弈G继承而来的信息结构、枝以及赢利赋予给H，而H中的参与人正好是博弈G中在H的某些信息集上行动的参与人子集。显然，H乃一扩展式博弈，我们称H为G的子博弈。若H是博弈G的子博弈，该子博弈以v为根节点，那么G的每一个到达v的纯策略组合都会在H中有一个副本sH，规定H中的参与人运用sH在H的每个节点上做出的选择要与其运用sG在G的每个同样的节点上做出的选择相同。我们称sH是sG对子博弈H的约束。假设σG=α1s1+…+αksk(Σiαi=1 )是到达H的根节点v的一个混合策略；并令I?{1,…,k}为指标集，满足当且仅当si到达h时有i∈I。令α=Σi∈Iαi 。那么，σH=Σi∈I(αi/α)si 就是定义于H上的混合策略，即所谓的σG对H的约束。由于σG会到达v，故α0，而系数αi/α 代表的是在到达h的条件下出招为si的概率。很明显，若sG是博弈G的纯策略纳什均衡，而H是G的子博弈且H的根节点可由sG达到，那么sG对H的约束sH必定是H中的纳什均衡。然而，如果sG不能到达H的根节点，那么sG对H的约束就不一定是H中的纳什均衡。原因在于，若某个节点不能由sG达到，那么在该节点进行选择的参与人之赢利就并不取决于其在G中的选择，但它却会依赖于他在H中的选择。当一个扩展式博弈对每个子博弈的约束都是子博弈的纳什均衡时，我们才说该扩展式博弈的纳什均衡是子博弈完美的。[105] 容易