网站大量收购独家精品文档,联系QQ:2885784924

人类经济行为研究新方法解读.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人类经济行为研究新方法解读分析

从“囚徒困境”到“互惠利他” ―人类经济行为研究新方法解读 武汉大学社会发展研究所 罗教讲 一、“囚徒困境”掀起轩然大波 1、“囚徒困境”的起因 博弈论中的经典是“囚徒困境”问题,它不仅是博弈论的起点,而且也是引发人类行为研究方法争论的核心问题。 2、“囚徒困境”的解释 在“囚徒困境”中,囚徒A和囚徒B都是理性人,以理性人的行为方式进行决策,囚徒A的严格优势策略(strictly dominated strategy)是“坦白”;同样,囚徒B的严格优势策略也是“坦白”,因此(坦白,坦白)是稳定的纳什均衡。但是(坦白,坦白)不是“帕累托最优”。显然,对囚徒A和囚徒B两个来说,最佳的选择是彼此“合作”,两人都“不坦白”,(不坦白,不坦白)才是“帕累托最优”。问题在于,(不坦白,不坦白)这个“帕累托最优”是不稳定的。因为自私的理性人不会为他人着想,更不会相信他人。此时两人都面临一个巨大的诱惑,当一方“不坦白”时,另一方选择“坦白”可以获得巨大的回报。理性人A和B都期望自己获取更大的收益,都要防范着对方,不让自己成为牺牲品。理性算计的结果,A和B最终选择“不合作”的“坦白”。这是“囚徒困境”唯一稳定的“纳什均衡”。 3、“囚徒困境”的结果引起争论 人们从“囚徒困境”得出的结论是:由于理性人在“囚徒困境”博弈中不能达到合作的结果,因此在理性与效率之间出现了不可调和的矛盾,个体的理性导致集体的非理性。 这种状况使经济学和经济学家陷入尴尬的两难境地。“如果坚持‘理性’是人类行为的唯一根据,那么经济学就必须放弃其效率原则;如果坚持效率原则,经济学就必须承认,最起码在某些场合,比如‘囚徒困境’条件下,导致人类合作的依据并非是理性的。” 常识和经验都告诉人们,合作导致效率,动物界和人类到处都可以见到合作行为,动物与人类如果没有互助与合作行为,显然不能生存下去。因此,“囚徒困境”所揭示的人类理性与效率之间的矛盾,实质上归结为理性人在博弈中能否导致合作行为出现的问题。人类的合作行为是一种客观存在,理论对这种行为的产生机制不能做出合理的解释,只能说明理论存在问题,必须修改理论。 争论分为两派。一派认为,理性人在博弈中不可能出现合作的结果。 另一派认为,经济学中的理性人假设是正确的,理性人在博弈中能够产生合作行为。“囚徒困境”的一次性博弈,虽不能产生合作行为,但重复博弈便会导致合作行为的出现。 这种理论上的思辨和推断并不能令人信服,最有效的办法是让事实来说话。于是以各种科学方法和现代技术(包括实验方法、电脑模拟方法、生理心理学研究方法等)对以“囚徒困境”为原型的博弈行为进行研究,在经济学界形成一种热潮,其结果是形成了实验经济学、行为经济学、行为博弈论等新型经济学分支,而且影响日隆。2002年的诺贝尔奖授与行为经济学家丹尼尔·卡尼曼(Daniel.Kahneman)和实验经济学家弗农·史密斯(Vernon.Smith),显示了这个经济学新型领域研究成果的重要价值和美好的发展前景。 二、“一报还一报”震惊全世界 ? 1、艾克斯罗德用计算机模拟“囚徒困境”重复博弈 理性人在“囚徒困境”博弈中能否导致合作,人们进行了大量研究,其中以罗伯特·艾克斯罗德(Robert.Axelrod)所进行计算机模拟“囚徒困境”锦标赛最为著名。 竞赛一共进行了两次。艾克斯罗德为第一次竞赛制定的规则是:竞赛循环进行,每一个参赛程序都要与其他程序相遇。此外,每个程序还要与它自己和一个“随机”程序相遇。所谓“随机”程序,就是一个在竞赛中以相等的概率随机地选择合作或背叛的计算机程序。每两个程序之间博弈200次,博弈的支付规则为:双方合作各得3分;双方背叛各得1分;一方合作而另一方背叛,则合作者得0分,背叛者得5分。见博弈矩阵。 2、“一报还一报”博弈策略大获全胜 所谓“一报还一报”策略,就是以“合作”开始,然后便模仿对手的策略,对手“合作”,则选择“合作”;对手“背叛”,则选择“背叛”。因此,“一报还一报”程序是所有参赛程度中长度最短、最简单却步是最聪明、最理性的程序。这其中包含着丰富且深刻的道理,而这正是艾克斯罗德这项创新性研究的价值所在。 3、“一报还一报”为什么取胜? “一报还一报”策略具备4大特性: (1)善良性 (2)宽容性 (3)报复性 (4)清晰性 第二次竞赛的优胜者仍然是“一报还一报”程序。艾克斯罗德在总结这个颇为令人吃惊的结果时,在第一次竞赛结果总结时认为“一报还一报”具有“善良”、“宽容”、“报复”三个特性的基础上,又加上“清晰”特性。他认

您可能关注的文档

文档评论(0)

1520520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档