不完全信息动态博弈.docVIP

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4 不完全信息动态博弈 4.1 精炼贝叶斯均衡 N t1(p) t2 (1–p) 1 1 L R L R 2 2 L? R? L? R? L? R? L? R? u1 u1 u1 u1 u1 u1 u1 u1 u2 u2 u2 u2 u2 u2 u2 u2 参与人1的类型t为个人信息。 参与人2 不知道t,但知道t的概率分布。 博弈的时序: (1)参与人1选择行动a1 ?A1; (2)参与人2观察a1,选择a2 ?A2 博弈的收益: u1 (a1, a2, t ), u2 (a1, a2, t ) 精炼贝叶斯均衡 博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。显然,这里还需要附加一个条件,即给定一参与人对其他参与人的类型分布的先验概率密度,否则他将无法对选择的“最优性”加以判断。这种概率分布或密度来自于博弈开始之前参与人所拥有的信息,故称为“先验”信息或“先验”概率。 定义 一个人不完全信息动态博弈的参与人类型空间,条件概率,其中是参与人的类型,,的确定是通过Harsanyi转换实现的,因而参与人知道而其他除参与人之外的参与人不一定知道。一个类型依存的战略组合是一个纳什均衡,当且仅当有 条件概率是先验的,因为它是博弈所给定的条件,来自博弈开始之前参与人关于其他参与人类型的相关信息。当然,“自然”这个“参与人”并不包括在由下标标记的个参与人之中,但由Harsanyi转换所假定的参与人“自然”首先行动,它决定每一个参与人的类型,但除每个参与人自己能“观察”到自己的类型外,对于其他参与人的类型,他是只具有不完全信息的。按照上式定义的纳什均衡被称为贝叶斯纳什均衡,它在本质上并未体现出不完全信息静态博弈与不完全信息动态博弈的区别。动态博弈与静态博弈的本质区别在于动态博弈均衡中存在对“序贯理性”的要求。这样,我们需要对上式给出的纳什均衡加以精炼,以剔除含有不可置信承诺和威胁的均衡,这就是下面将要引入的“精炼贝叶斯纳什均衡”。 序贯理性在完全信息动态博弈中指的是参与人在任一子博弈上都选择最优的行动计划,而精炼均衡要求所有参与人的战略在任一子博弈上都是其在给定其他参与人战略选择下的该子博弈上的最优战略,即纳什均衡战略。在不完全信息动态博弈中,信息集不一定是单结的,因而真子博弈可能不存在。此时,序贯理性指的是任一参与人在从其任一信息集开始的随后的博弈中(后续博弈)所选择的行动计划都是最优的。对于任一参与人来说,当他处于某一信息集上时,他对其他的每一个参与人的类型有一个概率判断。在不完全信息动态博弈中,他在此时并不准确知道其他参与人的类型是什么,但知道其他参与人的类型为每一种特定的类型组合的概率是多少。于是,假定所有参与人都是风险中性的,则他将根据这种概率分布来选择使他的期望支付最大化的行动计划。 例: 市场进入博弈 例: 1 R L M 1 3 p 2 1- p L? R?

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档