不完全信息动态博弈要点分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不完全信息动态博弈 -完美贝叶斯均衡 为引进完美贝叶斯均衡这一概念,我们首选考虑一个完全但不完美信息的动态博弈。 易得该博弈有两个纯策略纳什均衡(U,L)和(D,R)。 并且(U,L)和(D,R)都是子博弈完美均衡。 但是,(D,R)显然依赖于一个不可信的威胁:对于player2来说,如果他开始行动,无疑R是个劣策略。正因为如此,player1决不会(只要他是理性的)因为player2威胁“取R”而被迫采取策略D,为极大化自己的利益,player1会取U,迫使player2只得采取行动L。 上述例子反映出一个事实,在信息完全但不完美的博弈中,尽管(D,R)是子博弈完美的,可是它依然依赖于一个不可信的空头威胁,因此我们理应将它从我们的合理预测中排除出去。 上例出现的主要问题之一是,player2在他将要采取行动的信息集上不知道哪一个结将会到达,也就是他完全不知道,player1若不取D,那么他究竟取U还是M。这时我们加强的条件将要求player2对于这个问题要有一定的新年,并在这个信念下采取最佳的策略行动。这就是R1和R2条件。 R1:在每一个信息集,在该集具有行动的局中人关于博弈到达信息集中的哪一个结必须有一个信念。对于非单结信息集,信念是信息集中各个结上的概率分布。 R2:在给定的信念下,局中人的策略必须是序贯理性的(Sequentially rational)。就是说,在每一个信息集,具行动的局中人所采取的行动(以及局中人往后的行动)在给定该局中人在该信息集上的信念与其他局中人以后的策略下必须的是最优的。 一旦给定局中人在“不完美”信息集上的信念,可以计算局中人2的期望盈利。 若局中人2取L,期望盈利为 若局中人2取R,期望盈利为 无论p取何值,只要 ,总有 ,根据R2要求,局中人2不应取R。这要就排除了(D,R)这个均衡。 R1与R2的作用已经显示出来,作为对均衡精炼的要求, R1与R2坚持局中人必须有信念并且在这些信念下采取最优行动。可是并没有对局中人的信念提出任何要求。最起码地,我们设想“所赋予的”信念应当是合理的,只有合理的信念才可能有合理的预测。为了对局中人的信念进一步强加要求“它是合理的”,我们必须区分均衡路径上的信息集与非均衡路径上的信息集。 如果按照均衡策略进行博弈,将以正概率到达的信息集,则称这个信息集在均衡路径上。 如果按照均衡策略肯定达不到的信息集,则被称为不在均衡路径上。 现在先对均衡路径上的信念做出要求: R3:局中人在均衡路径上信息集的信念,是通过贝叶斯法则与局中人的均衡策略来确定的。 上例,假设局中人1以概率 取U,以概率 取M,以概率 取D,利用贝叶斯法则,不难得到局中人2的信念: 对于完美贝叶斯均衡来说,从 实际上抓住了它的主要精神:信念被提高到如同均衡定义中策略那样的重要地位。 几乎所有关于完美贝叶斯均衡的定义都包含了 的要求,其中大多数还包括了下面 。 :在非均衡路径上信息集的信念通过贝叶斯法则和局中人的可能的均衡策略来确定。 一个完美贝叶斯均衡由满足 的策略与信念构成。 对于子博弈完美纳什均衡(D,L,R’), 的要求是 “无所谓”的,因为不存在信息集在非均衡路径上,因此也不存在非均衡路径信息集上具行动的局中人的“可能均衡策略”。 现在考虑另一个策略剖面(A,L,L’)以及信念p=0。 首先断定,这些策略是一个纳什均衡:没有一个局中人会单方面去偏离该策略剖面,因为信念p=0,局中人1一旦偏离A将使他的盈利明显减少。而当局中人1选定A后,事实上博弈已经结束了,局中人2和3不存在什么偏离。并且这些策略满足 ,每个局中人在其信念集上有相信的信念。 这时候 可以对局中人3的信念强加限制:如果局中人2的策略是L,那么局中人3的信念p=1;如果局中人2的策略是R,那么局中人3的信念p=0。通过 的“强行要求”,倘若局中人3的信念相应于局中人2的可能均衡策略L是p=1,那么 必定要求局中人3选取R’而不是L’,这就表明,策略(A,L,L’)以及p=0一起不能构成完美贝叶斯均衡。正是由于 的作用,我们排除了一个不合理的纳什均衡与信念。 Thanks for your attention! *

文档评论(0)

宝贝计划 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档