《囚徒困境》中非纳什均衡出现可能性及其原因分析.doc

下载文档 降价啦

1
0
约5.66千字
约 11页
2018-08-21 发布于江苏
举报
版权申诉
保障服务

《囚徒困境》中非纳什均衡出现可能性及其原因分析.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

“囚徒困境”中非纳什均衡出现的可能性及其原因分析摘要：“囚徒困境”博弈是完全信息静态博弈的典型例子，被认为是上策纳什均衡，具有必然性，但在现实中非纳什均衡也同样出现。本文就“囚徒困境”中非纳什均衡出现的问题，对博弈的前提假设完全理性、完全信息以及概率进行了分析，得出的结论是：完全理性中的整体思维方式和概率为零的事件的发生以及完全信息等于一致信念时引起的不确定性，都可能导致非纳什均衡出现，而其出现的可能性则取决于采取整体思维方式的人的比例。关键词：囚徒困境；完全理性；概率；完全信息；整体思维方式 The Analysis about the Probability and Reasons of Non-Nash Equilibrium in Prisoners’ Dilemma Abstract: The prisoners’ dilemma, which is the representative example of complete information static game, is deemed to dominant-strategy Nash equilibrium and has the inevitability, but in fact non-Nash equilibrium also appears. To the question of non-Nash equilibrium in prisoners’ dilemma, this paper makes an analysis to Game Theory’s hypothesis: complete rationality, complete information and probability, and gets a result: systems thinking style in complete rationality, the happen of the event of zero probability, and the uncertainty that is brought out when complete information is concordant beliefs, all can bring the appearance of non-Nash equilibrium, and the probability of appearance is decided by the proportion of men who think in systems thinking style. Key Words: prisoners’ dilemma; complete rationality; probability; complete information; systems thinking style “囚徒困境”博弈是图克（Tucker）1950年提出的一个著名的博弈模型，是完全信息静态博弈的典型例子。一、 “囚徒困境”博弈及其纳什均衡囚徒困境博弈的基本情况如下：警察抓住了两个合伙犯罪的罪犯，但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟，并给他们同样的选择机会；如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判1年徒刑；如果两人中有一人坦白认罪，则坦白者从轻认罪，立即释放，而另一人则将重判8年徒刑；如果两人同时坦白认罪，则他们将被各判5年监禁。? 如果分别用－1、－5和－8 表示罪犯被判刑1年、5年和8年的得益，用0表示罪犯被立即释放的得益，则两囚徒的得益矩阵如下：囚徒2 坦白不坦白囚徒1 坦白－5，－5 0，－8 不坦白－8，0 －1，－1 在上图中，“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方，也就是两个罪犯；他们各自都有“不坦白”和“坦白”两种可选择的策略；因为这两个囚徒被隔离开，其中任何一人在选择策略时都不可能知道另一人的选择是什么，因此不管他们决策的时间是否真正相同，我们都可以把他们的决策看作是同时做出的。其中矩阵中第一个数字代表决策结果后囚徒1的得益，第二个数字代表决策结果后囚徒2的得益。博弈的结果是：由于这两个囚徒之间不能串通，并且各人都追求自己的最大利益而不会顾及同伙的利益，双方又都不敢相信或者说指望对方有合作精神，因此只能实现对他们都不理想的结果（各判5年），并且这个结果具有必然性，很难摆脱，因此这个博弈被称为“囚徒困境”。［1］二、非纳什均衡出现的可能性及其原因分析 1、完全理性与非纳什均衡囚徒困境