博弈论囚徒困境.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论囚徒困境

博弈论囚徒困境 博弈论囚徒困境 2.他们可以采取的行动 (actions) 或策略(strategies) 博弈(game)的要素 1.参与人或者局中人 (players ) 3.局中人可能得到的赢利(payoffs)。 每个局中人的目标:最大化其赢利 每个人的赢利不仅取决于自己如何 “出招”,也取决于别人如何“出招”。 博弈无处不在 公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。 如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。 囚徒困境的提出 囚徒困境是博弈论中的一种矛盾,反映个人最佳选择并非团体最佳选择。现实中的市场竞争、政治角逐、情场争锋等方面会频繁出现这样的情况。1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关悖论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。 合作(不坦白)?背叛(坦白)? 囚徒困境模型 警方逮捕甲、乙两名嫌疑犯,但没有足够证 据指控二人入罪。于是警方分开囚禁嫌疑犯, 分别和二人见面,并向双方提供以下相同的选 择:   若一人认罪并作证检控对方(相关术语称 “背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。   若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。   若二人都互相检举(互相“背叛”),则二人同样判监2年。 -2,-2 0,-10 背叛 -10, 0 -0.5,-0.5 合作 背叛 合作 囚徒乙 囚徒甲 囚徒困境赢利表(Payoff Table) 囚徒困境解说   如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒困境解说 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:   若对方沉默、背叛会让我获释,所以会选择背叛。   若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 囚徒困境解说 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。   这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低,这里存在着矛盾。 纳什均衡通俗解释 我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达纳什均衡含义:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。这就是说:双方在对方的策略给定的策略下不愿意调整自己的策略。这里的策略包括混合策略。 在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。 囚徒困境的内在根源    是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性和集体理性的矛盾引起的。 囚徒困境的启示 “囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。 “纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。《国富论》中有这样一句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益

文档评论(0)

almm118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档