关于囚徒困境思考.docVIP

下载本文档

58
0
约3.47千字
约 8页
2018-08-20 发布于福建
举报
版权申诉

关于囚徒困境思考.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关于囚徒困境思考

关于囚徒困境思考　　【摘要】囚徒困境是博弈论中具有代表性的例子，反应个人最佳选择并非集体最佳的情况，属于非零和博弈的一种。它告诉我们，看待问题的角度会对我们所得的结果有很大的影响。当我们悲观面对时，结局是悲惨的；但当我们乐观面对时，结局是美好的。　　【关键词】囚徒困境博弈经济学思考　　囚徒困境是博弈论中具有代表性的例子，反应个人最佳选择并非集体最佳的情况，属于非零和博弈的一种。虽然困境本身只是一种模型，但在实际生活中的价格竞争，环境保护等方面有多种类似的情形存在。对囚徒困境的研究，是对生活中各种博弈的一种基本形式的研究，对我们在实际生活中更好的认识各事物间的关系有很大的帮助。　　下面我们从两个人各自的角度来看，由于每个人都是自私的，都会寻求自身利益最大化，所以当他们从自己的角度去看待这个问题的时候，都只会选择最优于自己的方案。　　对于集体而言，当两人都选择不坦白时两人都会有最好的结局，但是由于他们之间不能互通信息，所以每一方都担心对方坦白而自己不坦白时自己所遭受的重判。在这种情况下，每个囚犯从自己的利益考虑，最后的选择都是坦白，即图中二人的选择重合的部分。虽然这种结果达到了这个博弈的占有策略均衡，及纳什均衡，但并未达到帕累托最优状态，这种个人最佳选择与集体最佳选择不一致的情况就是囚徒困境。　　前面所分析的博弈只是一次性的，即每个囚犯只有一次选择的机会，而且，在每个囚犯选择自己的策略是，他并不知道对方的选择。也可以理解为，每个囚犯只是做出了自己的一次性选择。在一次性的困境中，每个囚犯的策略选定了，则整个博弈的均衡结局也就确定了，每个囚犯都不可能再对博弈的过程和结果时间什么影响，即静态博弈。与之相对应的是动态博弈。动态博弈是反复进行的博弈。重复的博弈是动态博弈的一种特殊情况，在重复的囚徒困境中，结构相同的困境被重复多次。　　下面我们从囚徒困境发生次数的不同来看待其结果是否相同。　　如果囚徒困境只发生一次，则二者都必会为自身的利益最大化而坦白一切。　　如果使囚徒困境发生的次数大于一次，则概括而言囚徒困境进行第一次后会出现以下两种情况：　　（1）甲在第一次中被乙指控，即会在第二次指控乙，最终导致，甲即时获释，乙服刑10年。若乙的想法和甲一样，同样指控了甲，则二人同服刑8年。　　（2）双方均保持沉默，即会建立互信的合作关系，最终导致，二人同服刑1年。　　但互信的关系并非牢不可破，这一点也可以被利用，即甲，乙在第一次中共同选择了沉默而赢得对方的信任，进而进行合作，但甲或乙中的一人可以在获得对方的信任后，都会为了自己的利益考虑，利用对方的信任以获取自身利益最大化，即指控对方获得自由，而对方将服刑10年。这是一个以牺牲对方利益为代价而获得自身最大利益的一种策略。但是，这种策略并不会长久得逞，在重复的博弈中，对方会在后面的次数中进行报复。　　如果假设，两个囚徒均欲利用此策略，并将局数推演为十次，那么就会出现如下的情况：在第一局到第九局的过程中双方均会保持沉默，以期望建立互信关系，并在最后一局，即第十局指控对方，这将最终导致，二人同服刑1年。　　若再一次假设，双方都明确对方会使用与自己同样的策略，即知道对方会在第十局中指控自己，这样，一般认为在第九局时两者间的合作关系的建立即是没有意义的，如此类推，第八局到第一局中的合作关系的建立也同样是没有意义的，即第十局双方都会互相背叛，也就是纳什均衡。由此可推论，在如此的情况下，只有在囚徒困境的局数在不确定的情况下（即双方均不知道进行的局数），才会出现互相保持沉默以获得信任保持合作关系的现象。　　以上一段是通常的看法。然而我个人认为，从始至终的信任关系是有意义的。既然二人都已知囚徒困境共有十次，并准确判断在第十次时指控对方会获得自身利益最大化，并且两人都知道对方将在最后一次他们互相指控，并分别服刑8年。那么如果他们继续保持合作关系，则可使每人的服刑年数减少到1年，这也提高了自身利益。同时，由于困境发生十次，那么前九次的合作关系就尤为重要了，因为任何一次的背叛都会使同伴在下一次的困境中进行报复，而被报复的人也可以对此进行预知，这样循环往复，两人都会被不断判处8年刑期，显然这并不是最好的选择。我认为，在一切前提都已知的情况下，假设信息是完全的，即两个囚犯都已知困境的次数以及判刑的标准，那么两人从第一次开始便保持沉默进行合作，直到最后一次仍保持沉默，这样两个人的利益才是最大化的。即使不是父子或者情侣，只要是理性的囚犯，就应该选择这种最优的方式。即我个人认为，从第一局到最后一局二人都保持合作关系才能达到帕累托最优状态。　　当然，当困境局数不确定，或一直进行下去的话，由于双方不知道困境什么时候会结束，或者不知道自己的生命什么时候是尽头，那么保持沉默维持合作关系无疑是最好的选择。