4 不完全息动态博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主要内容 非合作博弈论 2 完全信息静态信息博弈-纳什均衡 3 完全信息动态搏弈- 4 不完全信息静态博弈-贝叶斯纳什均衡 5 不完全信息动态博弈-精练贝叶斯纳什均衡 4 不完全信息动态博弈 1 不完全信息动态博弈 成语故事:黔驴技穷-驴虎博弈 老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的,毛驴也是如此。最终老虎将毛驴吃掉。 1 不完全信息动态博弈 例,张三与李四的博弈 张三恃强凌弱,第一次与李四见面,不知李四强弱。但对李四类型有先验概率{0.8,0.2} 张三通过观察李四吃辣椒的数量修正李四强弱的看法(后验概率),并以此确定对李四的态度 李四预测到这一点,即使生性懦弱,也会强迫自己吃辣椒,以传达对自己有利的信息。 1 不完全信息动态博弈 两种结果: ——懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足够多,使得懦弱李四不敢模仿。张三能够区分李四类型并选择是否欺负李四。 ——两类李四都吃同样多辣椒,张三不能从李四吃辣椒行为中推出自己的信息,维持对李四的类型的先验信念{0.8,0.2} 1 不完全信息动态博弈 类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不知道。--不完全信息 行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观测到其类型。--动态博弈 但是,参与人行动是类型依存的,每个参与人的行动都传递有关自己类型的信息,后行动者可以通过观察先行动者的行动来推测其类型并选择自己的最优行动。先行动者预测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息。 2 基本思路 T=2, 企业的行动选择是一个简单的静态博弈决策问题,但在第一阶段,情况要复杂得多: 进入者是否进入依赖于它对在位者成本函数的判断:给定在位者是高成本时,进入者进入的净利润是1,低成本时进入者的利润是-1,当只当进入者认为在位者是高成本的概率大于1/2时,进入者才选择进入。 但与静态博弈不同的是,在观测到在位者第一阶段的价格选择后,进入者可以修正对在位者成本函数的先验概率x,因为在位者的价格可能包含其成本函数的信息。 2 基本思路 如:低成本的在位者无论如何不会选p=6,因此,如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本,选择进入是有利可图的。预测到p=6会招致进入者进入,即使高成本的在位者也可能不会选择p=6,而招致进入者的进入。 2 基本思路 一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入,从而使在位者在第二阶段得到的是垄断利润而不是古诺均衡利润,如果垄断利润与古诺均衡利润的差距足够大,在位者选择一个非单阶段最优价格可能是最优的。 2 基本思路 给定p=6不可能是低成本在位者的最优选择:如果在位者选择了p=6,进入者为什么仍然认为在位者是高成本的概率小于1/2呢? ——在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡概念中没有规定参与人如何修正自己的信念。 2 基本思路 2 基本思路 精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求: 1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念); 2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的; 3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。 3 贝叶斯法则 在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。 统计学上,修正之前的判断称为“先验概率” 修正后的判断称为“后验概率” 贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。 3 贝叶斯法则 假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,?k和ah分别代表一个特定的类型和一个特定的行动。 如果我们观察到i选择了ah,i属于?k的后验概率是多少? 3 贝叶斯法则 3 贝叶斯法则 4 精炼贝叶斯均衡 精炼贝叶斯均衡是一个战略组合s*(?)=(s1*(?1),…,sn*(?n))和一个后验概率组合 ,满足: (P)对于所有的参与人i,在每一个信息集h,存在 ——参与人的战略是序贯理性的,即在每个参与人的信息集中,给定这个人的信念以及其他参与人的战略,他在该信息集中的选择以及之后的行动是他在这些前提下的最优行动。 (B) 是使用贝叶斯法则从先验概率pi(?-i??i),观测到的最优战略s*得到的。 4 精炼贝叶斯纳什均衡 精炼贝叶斯均衡是均衡战略和均衡信念的结合,给定信念: 是使用贝叶斯法则从均衡战略和所观测到的行动得到

文档评论(0)

wtw4044 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档