博弈论7不完全信息动态博弈资料课件.pptxVIP

博弈论7不完全信息动态博弈资料课件.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 不完全信息动态博弈 v 至少部分博弈方没有关于得益 全部信息的动态博弈,称“不完全 信息动态博弈”或“动态贝叶斯博 弈’。 1 v在不完全信息动态博弈中, 按照海萨尼转换, 博弈进行的先后顺序可以描述为: v首先, “自然” 选择参与人的类型,参与人 自己知道,其他参与人不知道; v其次, 参与人开始行动,参与人的行动有先 有后,后行动者能观测到先行动者的行动, 但不能观测到先行动者的类型。 2 v参与人的行动是类型依存的,每个参与人的 行动都传递着有关自己类型的某种信息, v后行动者可以通过观察先行动者所选择的行 动来推断其类型或修正对其类型的先验信念( 概率分布),然后选择自己的最优行动。 3 v先行动者预测到自己的行动将被后行动 者所利用, 就会设法选择传递对自己最 有利的信息,避免传递对自己不利的信息。 v 因此,博弈过程不仅是参与人选择行动 的过程,而且是参与人不断修正“信念” 的过程。 4 v例题1: v参与人i=1,2; v参与人1的行动空间A1= {L,R} v参与人1的类型空间T1= {t11,t12 } v参与人2的行动空间A2= {A,B} v参与人2的类型空间T2= {t2 } ,单点集,因此 参与人1对参与人2的信念p1=1; v参与人2对参与人1的信念p2=(p,1-p); v参与人1先行动,参与人2后行动。 5 按照海萨尼转换,该博弈表示为: 6 v 例题2:考察一个市场进入博弈 v 参与人i=1,2; v 参与人1 (在位者)的行动空间 A1= {m1 (低价格),m2 (高价格)} v 参与人1的类型空间 T1= { t11 (高成本),t12 (低成本)} v 参与人2 (进入者)的行动空间 A2= a1 (进入),a2 (不进入)} v 参与人2的类型空间T2= {t2 } ,单点集,因此参与人 1对参与人2的信念p1=1; v 参与人2对参与人1的信念p =(p,1-p); 7 2 按照海萨尼转换,该博弈表示为: 8 v 注释: v 参与人i对其他参与人的类型(私人信息) t-i的 信念 称为先验概率。 v 当参与人 i在他的某个信息集h上观察到其他 n-1个参与人行动组合 ,条件概率 , 是参与者i在观察到 的情况下,对参与者的类型t-i的修改,这个修 正产生 的推断称为后验概率 9 v在例1图7-1中,设R(t11),R(t12)是参与人1的 两个战略。从而该博弈表示为完全但不完美 的动态博弈图7-3 。 10 11 2,2 2,2 0,0 0,1 1,0 3,1 12 v但(L,A)又排除不掉,因为没有子博弈。 v假设在参与人2的信息集h2上,观察到R产生 的后验概率为 v v这时,参与者2选择A的期望收益为: 0*q+0*(1-q)=0 选择B的期望收益为: 1*q+1*(1-q)=10 所以参与人2一定会选择B. 13 v参与人1知道理性的参与人2轮到他决策的 信息集h2上会选择B,因此参与人的最优 战略就是R(t12). v 既然参与人1决定选择R(t12),因此参与 人2修正的信念推断是 v ,所以就删掉了( L,A ) 14 7.1 精炼贝叶斯纳什均衡 v7.1.1后续博弈 v引入精炼贝叶斯均衡的目的是: v为了进一步强化(即加强对条件的要求 )贝叶斯纳什均衡,这和子博弈精炼纳 什均衡强化了纳什均衡是相同的。 15 v 用更为广义的后续博弈的概念来代替子博弈,后续 博弈可开始于任何信息集(而不论是否单结)。 v 其后,进行相似的分析:如果参与者的战略要构成 为博弈的一个精练贝叶斯均衡,它不仅必须是整个 博弈的贝叶斯纳什均衡,而且必须构成每一个后续 博弈的贝叶斯均衡。 v [例子]:市场进入博弈(该博弈的扩展式表述模型 见图7.2) 16 v如果我们将从每一个信息集开始的博弈 的剩余部分称为一个“后续博弈” (注意 与子博弈的不同:子博弈必须开始于单 结信息集),一个“合理”的均衡应该满 足: v给定每一个参与人有关其它参与人类型 的后验信息,参与人的战略组合在每一 个后续博弈上构成贝叶斯均衡。 17 v精炼贝叶斯均衡是贝叶斯均衡、子博弈精练 均衡和贝叶斯推断的结合。它要求: v (1) 在每一个信息集上,决策者必须有 一个定义在属于该信息集的所有决策结上的 一个概率分布(信念); v (2) 给定该信息集上的概率分布和其他 参与人的后续战略,参与人的行动必须是最 优的; v (3) 每一个参与人根据贝叶斯法则和均 衡战略修正后验概率。 18 7.1.2 贝叶斯法则 v 统计学上,修正之前的判断称为 “ 先验概率”,修正之后的

文档评论(0)

布鲁斯丶李 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档