《博弈论：原理、模型与教程》第02章nash均衡第01节占优行为.doc

下载文档 降价啦

1
0
约3.63千字
约 9页
2021-07-22 发布于天津
举报
版权申诉
保障服务

《博弈论：原理、模型与教程》第02章nash均衡第01节占优行为.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

《博弈论：原理、模型与教程》第一部分完全信息静态博弈第 2 章 Nash 均衡本章将通过分析理性参与人在博弈中的选择行为，探讨完全信息静态问题的求解，并给出完全信息静态博弈的解— Nash均衡。 2.1 占优行为（已精细订正！）首先考察博弈论中最为经典的一个博弈模型— “囚徒困境” prisoners ’ dilemma ）博弈。两个小偷作案后被警察抓住，分别关在不同的屋子里审讯。在审讯之前，小头偷从律师那里得知：如果两个人都坦白，将被个判刑 4 年；如果两个人都抵赖，将会因为证据不足而各判 1年；如果其个一人坦白另一人抵赖，坦白的讲将会得到宽大处理而被无罪释放，而抵赖的将被重刑，判刑 6 年。试问两个小偷将会如何选择？上述“囚徒困境” 博弈问题是 Tucker 在 20 世纪 50 年代提出的，该问题不仅“可以作为实际生活中许多现象的一个抽象概括” ，而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。在“囚徒困境”博弈问题中，参与人是两个小偷，参与人的战略都是：坦白和抵赖，支付就是在各种选择下所得到的刑期。图 2-1 给出了“囚徒困境”博弈问题的战略式描述。小偷 2 坦白抵赖坦白 -4， -4 0， -6 小偷 1 抵赖 -6， 0 -1， -1 图 2-1 “囚徒困境”博弈显然，在“囚徒困境博弈”中，小偷选择的结果不仅与自己的选择有关，而且与另一小偷的选择有关，那么小偷如何选择呢？不妨这样考虑小偷的决策过程：假设对方坦白，自己该怎么做；假设对方抵赖，自己应该怎么做。也就是，给定另一小偷的决策，寻找自己的最优决策。对于每个小偷，当对方坦白时，自己坦白得 4 ，抵赖得 6 ，所以应该选择“坦白” ；而当对方抵赖时，自己坦白得 0 ，抵赖得 1，所以还是应该选择“坦白” 。也就是说，无论对方如何选择，每个小偷都会选择 “坦白”。因此，博弈的结果就是两个小偷都选择 “坦白”。两个小偷都选择 “坦白”，这样的结果似乎与我们的直觉相矛盾。因为在“囚徒困境”的 4 种结果（即 (坦白，坦白 ) 、 (坦白，抵赖 ) 、(抵赖 ,坦白 ) 、(抵赖 ,抵赖 ) ）中，虽说不能肯定 (坦白，坦白) 这个结果是最差的，但它显然不如 (抵赖 , 抵赖 ) 。这是因为 (坦白，坦白 ) 导致两个小偷都得 4 ，而 (抵赖 ,抵赖 ) 却能使大家都得 1 ，也就是说， (抵赖, 抵赖) 是 Pareto 优于 (坦白，坦白) 的。既然选择“抵赖”对双方都有好处，那么两个小偷是否都会选择 “抵赖”呢？只要小偷是前面所假设的完全理性的参与人，答案就是否定的。不妨假设两个小偷都选择“抵赖” ，现在分析小偷的这种选择是否是理性的。对小偷 1 而言，小偷 2 选择“抵赖”的情况下，自己选择“抵赖”得 1，选择“坦白”得 0 ，显然“坦白”优于“抵赖” 。因此，理性的小偷 1 将会偏离“抵赖”而选择“坦白” 。基于同样的原因，理性的小偷 2 也会偏离“抵赖”而选择“坦白” 。除了 (坦白，坦白) 和 (抵赖 ,抵赖 ) 以外，“囚徒困境” 是否会出现其他结果呢？比如说一个人坦白，一个人抵赖？我们说这样的结果也是不会出现的，因为在对方选择“坦白”的情况下，自己选择“抵赖”显然是不理性的。剩下的问题是：当两个小偷都选择 “坦白”时，是否有人偏离 “坦白”而选择“抵赖” 。基于同样的分析，两个小偷只要是理性的，这种情况就不会发生 1。因此，虽然结果 (抵赖 ,抵赖 ) 是结果 (坦白 ,坦白 ) 的 1 也许有人会问：如果两个小偷在被抓之前就制定攻守同盟，决定双方选择“抵赖” ，这是否可以是博弈的结果为 (抵赖 , 抵赖 ) 呢？这要取决于 “攻守同盟” 对双方是否具有约束力，是否对双方的支付产生影响。只要这种“攻守同盟”对双方的选择没有约束力，不能对违 Pareto 改进（即所有的人都得到好处），但只要两个小偷是理性的，这种对所有人都有好处的 “改进” 两人都无法得到。这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾” 。事实上，“囚徒困境”在现实生活中有着许多应用。也许“囚徒困境”博弈是人们虚构出来的一个博弈模型，但在现实生活中与 “囚徒困境” 相似的情形却很多。例如，寡头垄断市场上厂商间的价格大战，就是典型的“囚徒困境“。 20 世纪 90 年代末期我国出现的彩电企业间的价格大战就是这种情形，还有目前人们议论比较多的有关中小学生教育方式的选择。家长明知道素质教育对孩子的长远发展更有益处，但为了应付各种各样的升学考试，也不得不让孩子参与各种名目的“模拟考试”或“考试培训” ，这也是典型的