主体间性与囚徒困境.docVIP

下载本文档

6
0
约5.68千字
约 10页
2017-06-20 发布于北京
举报
版权申诉

主体间性与囚徒困境.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

主体间性与囚徒困境.doc

主体间性与囚徒困境　　摘要：通常我们所考虑的“囚徒困境”博弈均为一次性的完全信息的静态博弈。著名学者阿克塞尔罗德所举办并研究的“重复囚徒困境”竞赛，从一方面揭示了在囚徒困境这个博弈中采取怎么样的策略可以使博弈双方从对抗走向合作，但是也潜在的使一次性完全信息静态的囚徒困境博弈从规则上发生了改变――主体间性在博弈参与人中日益显得重要起来。参与博弈的理性人是否能够像人工智能体Agent那样具备主动交互并改变自己策略的能力？如果可以，也许将在囚徒困境这种模型的博弈研究中做出一点贡献。　　关键词：囚徒困境规则主体间性理性　　　　一、关于理性人和囚徒困境的介绍　　　　囚徒困境这个事例常常在有关博弈论的讨论中出现，它最主要贡献是突出反映了个体理性与群体理性的冲突，并且在目前学界的讨论下，这一冲突似乎尚未能得到完美的解决。造成这一冲突的原因，并不是由于该博弈的前提――理性人假设出现了问题，而是基于囚徒困境中或者博弈论中理性人的假定在不同条件（规则）下的作用。正是由于没有分清这一前提在不同背景知识下的运用，一方面保证了囚徒困境这个博弈能够用逻辑的或者说是理性的方式解决（找到这个博弈的纳什均衡点），另一方面也导致了事件的解决结果并不是那么的令人满意（因为我们面临的是不同的条件与知识背景）。“‘博弈参与人是理性的’是博弈论的公设，然而理性人的假定存在许多博弈困境。囚徒困境与公地悲剧反映的是个体理性与集体理性之间的冲突”（潘天群《博弈论中理性人的假设困境》，《经济学家》2003.4，）。　　起初，博弈论专家假定博弈中的参与人是理性的――具有使自己效用最大化的推理能力，然而，奥曼等人发现，这样的假定是不够的，我们必须假定，“一个博弈中的每个参与人都是理性的”是该博弈所有参与人组成的“群体”所知道的，即每个人都是理性的是群体中的“公共知识”（或翻译成共同知识）。（潘天群《群体推理的逻辑与群体理性》，《东南大学学报（哲学社会科学版）》，2007年7月第9卷第4期）。　　有关囚徒困境我们可以这样表述。　　假设有A、B二人，因为偷盗被警察抓捕归案。为了防止两人串供，因此将两人分开审问。这时A、B二人均面对了两种选择，一是招认，二是不招认。例如，对于A来说，A面临着招认与不招认的选择。我们可以假设，如果A招认，B可以选择招认，也可以选择不招认。当A招认B不招认时，A当场释放B判刑8年；当A招认B也招认时，各判刑5年。如果A不招认，B也可以选择招认或者不招认。当A不招认B招认时，B当场释放，A判刑8年；当A不招认B也不招认时，两人各判刑1年。　　同理，当审问B的时候，只需要参考上面的过程就可以很容易地得到答案。　　我们可以简单地列一个表，用来表示上述的过程：　　　　以A为例，对该博弈进行分析。　　由于参与博弈的双方均为理性人，且为公共知识，那么A会有如下的思考：　　当B招认时，A可以选择招认或者不招认。　　当B招认而A不招认的时候，B被当场释放，A被判刑8年；当B招认A也招认时，B与A各判刑5年。判刑5年远远好于判刑8年，因此，当B招认时，基于理性人的假设要使自己的收益最大并且损失最小，A会毫不犹豫地选择招认。　　当B不招认时，A也可以选择招认或者不招认。　　当B不招认并且A也不招认时，两人各判刑1年。当B不招认而A招认时，B被判刑8年，A被当场释放。A基于理性人假设作出了以上的推理，显而易见的是，当场释放要好于判刑1年。为了使自己收益最大并且损失最小，A会毫不犹豫地选择招认。　　因此，不管B是否招认，A都会毫不犹豫地选择招认。　　同理，作为一个理性人，B也会按照A的思维模式那样作出选择，答案是――毫不犹豫地招认。　　两人均招认就是囚徒困境这个博弈的纳什均衡点。很明显也很抱歉，通过理性手段进行推理，想使自己的收益最大而损失最小，但是结果却不是那么的令人满意。在我们看来，两者均不招认各判刑1年的损失要远远小于两人各判刑5年，或者单就A或B一个人来说，当场释放的收益要明显地大于个人的判刑5年，因此，在某些人看来，理性的参与人在这个博弈中并不能使自己的收益最大损失最小，相反的，个人理性在这个囚徒困境的博弈中成为了获得最大利益的障碍，在这样的情况下，就出现了“两难”决策。　　　　二、“囚徒困境”博弈的潜在规则，以及阿克塞尔罗德的实验及其规则变动　　　　应该得出的一个认识就是，上文所提到的那个“囚徒困境”博弈属于一次性的完全信息静态博弈，它本身所具备的规则与阿克塞尔罗德所做的实验有着显著的区别――一次性的囚徒困境博弈与重复性的囚徒困境博弈的规则区别。为了便于分辨，我们依次将上文的两个囚徒困境博弈分别简称为Game1与Game2。　　G1应该具备以下的这些规则。