第29章博弈论的应用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第29章 博弈论的应用 本章主要研究博弈论中的4个非常重要的问题:合作问题、竞争问题、共存问题和承诺问题。 一、博弈论分析的重要工具 1、最优反应曲线 在两个人的博弈中,假如存在一个纳什均衡,这个纳什均衡可以如下表示: 假设参与人A的选择为r1,r2,…,rr ,参与人B的选择为c1 ,c2,…,cc 。对于参与人A的每一个选择r,bc(r)表示参与人B的最优反应。相应地,对于参与人B的每一个选择r,br(c)表示参与人A的最优反应。纳什均衡为: c*= bc(r), r*= br(c)——反应函数 即:每个人的选择正好是对方对自己预期的选择——“相互一致”。根据以上函数可以得到反应曲线。 2、混合策略 在以下收益矩阵,我们令参与人A选择“上”的概率为r,选择“下”的概率为1-r,同样,我们令参与人B选择“左”的概率为c,选择“右”的概率为1-c。当r和c等于0时,相应的策略为纯策略。根据收益矩阵和参与人选择的概率,可以得到参与人的期望收益。 根据上表,参与人A的期望收益为:2rc+(1-r)(1-c)。即:2rc+1-r-c+rc。 如果r增加了△r,A的收益变化为:2c△r-△r+c△r=(3c-1)△r。即如果3c1时,A将增加r,如果3c1,A将减少r,如果3c=1时,他对于任意的0≤r≤1无差异。 根据同样的方法,得到参与人B的期望受益:cr+2(1-c)(1-r)。 当c增加△c时,B的收益变化为:(3r-2)△c。 因此,当r2/3时,B增加c将增加收益;当r2/3时,B将减少c;当r=2/3时,他对于任意的0≤c≤1无差异。 利用以上两个结论可以绘制参与人的最优反映曲线。 如果参与人B选择c=0,那么参与人A将减少r,使r尽可能小,所以r=0。因此,参与人A使r=0就是对c=0的最优反应。并且,r=0一直都是A的最优反应,直至c=1/3。当c=1/3,0≤r≤1都是A的最优反应。对于所有的c1/3,行参与人的最优反应是r=1。 二、合作博弈 又称协调博弈,在这类博弈中,当参与人能够协调他们之间的策略时,他们的收益就会最大。关键是如何创建这种协调机制。 1、性别战 假设有一个男孩和一个女孩约会看电影,但他们事先没有约好看哪一部电影,而且都忘了对方的电话号码,所以没有办法协调他们的约会,只能猜测对方喜欢看那一部电影。 男孩想看最新推出的动作片,女孩喜欢看文艺片,但他们都宁愿看同一部电影也不愿意放弃约会。 协调博弈的特征:参与人在协调行动时获得的收益要大于单独行动时的收益。 性别战的纳什均衡 在以下的收益矩阵中,可以用上一节中的反应曲线来求解纳什均衡。根据上节的结论,存在三个纳什均衡:上方都选择动作片或文艺片,或者双方分别按2/3的概率选择各自偏好的影片。 究竟哪种均衡会发生,要依据特殊情况而定。当参与人完全有理由相信,其中的一个均衡相对于其他的均衡更“自然”,这个均衡将是最终的选择点,被称为博弈的聚点。 2、囚徒困境 在该博弈中,坦白是一个占优策略,但双方都抵赖(协调)是更好的选择。协调能够使囚徒获得最大化的收益。 解决囚徒困境的方法之一是无限重复博弈。参与人通过将来的行动来奖励合作和惩罚不合作。 另一种方式是缔结合约(协调)。双方可以签订一份合同,如果一方违约,他将支付罚金或接受其他某种方式的惩罚。但这要依赖于能够强制执行这种合同的法律体制的存在。 3、保证博弈 类似囚徒困境,例如美国和苏联之间的军备竞赛。两个国家都可以选择生产核导弹,也可以选择都不生产。其收益矩阵如下图。 该图显示:存在两个纳什均衡(不生产,不生产)和(生产,生产)。但是,(不生产,不生产)对双方都是一个较好的选择。 但问题在于,任何一方都不知道对方将会做出的选择。在承诺不生产以前,每一方都想得到对方不会生产的保证。 获得这种保证的方法之一是其中一方先采取行动,并接受公开的检查。这可以是一种单边的行动,但他一定要让对方相信自己的选择。 类似:战国时期,皇太子做人质。 4、斗鸡博弈 即电影中的汽车博弈:两个年轻人分别从一条街的两头,驾车笔直地是向对方。第一个转向的人会颜面尽失,但如果没有人转向,将会撞在一起。其收益矩阵如下图: 存在两个纳什均衡:(不转向,转向)和(转向,不转向)。A偏好第一个,B偏好第二个。但这两个都比撞车好。它和保证博弈有所区别,双方做不相同的事情比做相同的事情好。 在这个博弈中,每个参与人都知道如果他能够承诺直线驾驶,对方会因惧怕撞车而转向,从而实现对自己偏好的纳什均衡。但如果双方都这么想,则有可能会撞车。 因此,参与人的一个策略是让对方相信自己的承诺。例如,将自己的方向盘锁住。当然,如果两个人都上了锁,结果将是灾难性的。 结论:如何协调 在保证博弈、性别战和斗鸡博弈中,参与人为了实现自己偏好的纳什均

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档