《博弈论:原理、模型与教程》第02章nash均衡第01节占优行为.doc

《博弈论:原理、模型与教程》第02章nash均衡第01节占优行为.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《博弈论:原理、模型与教程》 第一部分 完全信息静态博弈 第 2 章 Nash 均衡 本章将通过分析理性参与人在博弈中的 选择行为 ,探讨完全信息静态问题的求解,并给出 完全信息静态博弈的解— Nash均衡。 2.1 占优行为 (已精细订正!) 首先考察博弈论中最为经典的一个博弈模型— “囚徒困境” prisoners ’ dilemma )博弈 。 两个小偷作案后被警察抓住, 分别关在不同的屋子里审讯。 在审讯之前,小头偷从律师那里得知: 如果两个人都坦白,将被个判刑 4 年;如果两个人都抵赖,将会因为证据不足而各判 1年;如果其个一人坦白另一人抵赖, 坦白的讲将会得到宽大处理而被无罪释放, 而抵赖的将被重刑,判刑 6 年。试问两个小偷将会如何选择? 上述“囚徒困境” 博弈问题是 Tucker 在 20 世纪 50 年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括” ,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。 在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。 图 2-1 给出了“囚徒困境”博弈问题的 战略式描述 。 小偷 2 坦白 抵赖 坦白 -4, -4 0, -6 小偷 1 抵赖 -6, 0 -1, -1 图 2-1 “囚徒困境”博弈 显然,在“囚徒困境博弈”中,小偷选择的结果不仅与自己的选择有关,而且与另一小偷的选择有关,那么小偷如何选择呢? 不妨这样考虑小偷的 决策过程: 假设对方坦白,自己该怎么做;假设对方抵赖,自己应该怎么做。也就是,给定另一小偷的决策,寻找自己的 最优决策 。 对于每个小偷,当对方坦白时,自己坦白得 4 ,抵赖得 6 ,所 以应该选择“坦白” ;而当对方抵赖时,自己坦白得 0 ,抵赖得 1, 所以还是应该选择“坦白” 。 也就是说,无论对方如何选择,每个小 偷都会选择 “坦白”。因此,博弈的结果就是两个小偷都选择 “坦白”。 两个小偷都选择 “坦白”,这样的结果似乎与我们的直觉相矛盾。因为在“囚徒困境”的 4 种结果 (即 (坦白 ,坦白 ) 、 (坦白 , 抵赖 ) 、(抵赖 ,坦白 ) 、(抵赖 ,抵赖 ) )中,虽说不能肯定 (坦白 ,坦白) 这个结果是最差的,但它显然不如 (抵赖 , 抵赖 ) 。这是因为 (坦白 ,坦白 ) 导致两个小偷都得 4 ,而 (抵赖 ,抵赖 ) 却能使大家都得 1 ,也就是说, (抵赖, 抵赖) 是 Pareto 优于 (坦白 ,坦白) 的。既然选择“抵赖”对双方都有好处,那 么两个小偷是否都会选择 “抵赖”呢?只要小偷是前面所假设的完全 理性的参与人,答案就是否定的。 不妨假设两个小偷都选择“抵赖” ,现在分析小偷的这种选择是否是理性的。 对小偷 1 而言,小偷 2 选择“抵赖”的情况下,自己选择“抵赖”得 1,选择“坦白”得 0 ,显然“坦白”优于“抵赖” 。因此,理性的小偷 1 将会偏离“抵赖”而选择“坦白” 。基于同样的原因,理性的小偷 2 也会偏离“抵赖”而选择“坦白” 。 除了 (坦白 ,坦白) 和 (抵赖 ,抵赖 ) 以外,“囚徒困境” 是否会出现其他结果呢? 比如说一个人坦白,一个人抵赖?我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。 剩下的问题是: 当两个小偷都选择 “坦白”时,是否有人偏离 “坦白”而选择“抵赖” 。基于同样的分析,两个小偷只要是理性的,这 种情况就不会发生 1。因此,虽然结果 (抵赖 ,抵赖 ) 是结果 (坦白 ,坦白 ) 的 1 也许有人会问:如果两个小偷在被抓之前就制定 攻守同盟 ,决定双方选择“抵赖” ,这是 否可以是博弈的结果为 (抵赖 , 抵赖 ) 呢?这要取决于 “攻守同盟” 对双方是否具有 约束力 , 是否对双方的支付产生影响。只要这种“攻守同盟”对双方的选择没有约束力,不能对违 Pareto 改进(即所有的人都得到好处) ,但只要两个小偷是理性的,这种对所有人都有好处的 “改进” 两人都无法得到。 这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾” 。 事实上,“囚徒困境”在现实生活中有着许多应用。也许“囚徒 困境”博弈是人们虚构出来的一个博弈模型, 但在现实生活中与 “囚 徒困境” 相似的情形却很多。 例如,寡头垄断市场上厂商间的价格大 战,就是典型的“囚徒困境“。 20 世纪 90 年代末期我国出现的彩电 企业间的价格大战就是这种情形, 还有目前人们议论比较多的有关中 小学生教育方式的选择。 家长明知道素质教育对孩子的长远发展更有 益处,但为了应付各种各样的升学考试, 也不得不让孩子参与各种名 目的“模拟考试”或“考试培训” ,这也是典型的

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档