高级微观经济学教案08-序贯博弈.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高级微观经济学教案08-序贯博弈

7.3.7序贯博弈 本节逻辑: 子博弈完美均衡并不能排除不可信的威胁和承诺。如图: 1 L M R (0,5) x p(x) 2 y p(y) l m r l m r (4,0) (-1,1) (0,4) (0,4) (-1,1) (4,0) 考虑博弈(L,m),给定参与人2选择m,参与任1的最优选择是L;给定参与人1选择L,参与人2选择其他策略和选择m的支付是一样的,也是最优的,但选择m是保证参与人1选择L的“威胁”,因而(L,m)是一个纳什均衡,而且这个博弈只有自身一个子博弈, 因而也是子博弈完美均衡。 但这不是博弈的真实结果,因为参与人2选择m不是一个可信的威胁。 考虑参与人1没有选择L。这样参与人2对于博弈进行到x,y的信念分别是p(x),p(y),p(x)+p(y)=1.这时,选择纯策略m的期望收益是:p(x)*1+p(y)*1=1。 混合策略(0.5,0.5)选择(l,r)的期望收益是: p(x)(0.5*0+0.5*4)+p(y)(0.5*4+0.5*0)=21。因而如果参与人1真的没有选择L,那么参与人1也不会选择m,威胁是不可信的,(L,m)不是真实的博弈结果。 那么,如何排除m这些不可信的威胁或承诺?方法:1、引进完美贝叶斯均衡;2、引进序贯均衡概念。 7.3.7.1信念 信念体系p(x)是指在在信息集I(x)上的一个概率分布,该概率分布描述了该信息集上的参与人关于博弈进入该信息集上每一个决策结的的概率(后验概率)。显然,这些概率和=1。如上例里p(x)+p(y)=1。 判断/状态(p,b)是一对信念体系/行为策略有序组合,给定状态(p,b),信念p可解释为给定行为策略b已被采取时,参与人所持有的信念。 在一个合理的状态中,信念体系p应当是应用贝叶斯法则从既定的行为策略b中推导出来的——当这样做是可行的,也就是在信息集在均衡路径上: 如图7.28。 贝叶斯法则:信念必定是利用贝叶斯法则由策略中推出的——当这样做是可行的。 当信息集不在均衡路径上时,贝叶斯法则不能运用,如图7.29。这时,可以认为每个决策结上的概率可以取任意值,如图7.30。 2、独立性:信念必定反映出参与人独立的选择他们的策略。 3、共同信念:具有相同信息的参与人具有相同的信念。 图7.30,7.31 满足1,2,3就是一致的。 定义7.20一致性判断 对于一个有限的扩展式博弈,如果存在一个完全混合的行为策略的序列bn——他收敛于b,使得贝叶斯法则归纳的信念体系的相关序列pn收敛于p,那么,判断(p,b)是一致的。 一致性判断要满足贝叶斯法则,独立性和共同信念。 7.3.7.2序贯理性 子博弈完美均衡要求在博弈的每一个子博弈上的选择都是最优的。这里,我们将其扩展,即要求每个参与人在其每一个信息集上做出的选择都是最优的。 怎样计算某个信息集上的支付? 设ui(b/x)是信息集I中的决策结x被博弈经过时给参与人带来的支付,给定信息体系(p,b),它给信息集上的每一个决策结分派了概率,那么,该信息集I上的期望支付是。 例图7.32 定义序贯理性 如果对于每一个参与人i,每一个属于参与人i的信息集I及其每一个行为策略,存在如下的关系式,那么对于一个有限扩展式博弈,判断(p,b)是序贯理性的:。 如果对于一些信念体系P,判断(p,b)如上面一样是序贯理性的,那么,我们也称行为策略组合b是序贯理性策略 也就是说,在博弈的任意决策结上(包括未被经过的),没有参与人有改变其策略的动机,那么该判断是序贯理性的。 这样,序贯理性可以排除图7.27的(L,m)策略组合。 所以,并非所有的子博弈完美均衡都是序贯理性的,同时也不是所有序管理性行为策略都是子博弈完美均衡。 例图7.34 定义7.22序贯均衡 对于一个有限 扩展式博弈,如果一个判断是一致的且序贯理性的,那么,它便是一个序贯均衡。 1、合理的形成一个一致性的判断;2、该判断上的策略使支付最大。 例7.7 1 弃权 (-2,1,1) H() T() (2,-1,-1) 弃权 [] 2 [] 弃权 (2,-1,-1) T() H() [] 3 [] H() H T H T T() (-4,2

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档