- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论中理性人假设的困境-PPT
BREAD PPT DESIGN 博弈论中理性人假设的困境 BREAD PPT DESIGN “理性人”的困境 理性人在博弈论中是指具有推理、决策能力并通过选择策略使自己的得益或支付最大的人。 然而,理性的参与人在某些博弈中并不能使自己的得益最大,在另外一些博弈中理性反而成为获得最大得益的障碍,在某些情况下理性人面临难以做出决策的二难,即:“理性人”面临着困境。 目录 个体理性与集体理性的冲突 1 理性原则间的冲突 2 过程理性与结果理性的冲突 3 加总群体偏好的理性规则缺陷 4 CONTENTS 1 结 论 5 一、个体理性与集体理性的冲突 在这个博弈中,两个囚徒均会选择“招认”,因为无论对方选择什么策略,自己选择”招认“是占优策略。双方均选择招认”的策略组合点是纳什均衡点。如果两个囚犯都选择“不招认”策略,结果是最理想的状态。但这个状态是达不到的,因为每个理性的囚徒均会主动偏离这个状态。一个稳定的状态是双方均选择“招认”,这是理性的囚徒难以摆脱的困境。 1. 囚徒困境 2.公共地悲剧 公共地悲剧是一中集体行动的悲剧。每个人均能够预先知道悲剧的必然性,因为这个必然性是每个人理性行为的结果,但每个人由于自己的理性,均不会约束自己的策略选择,因而悲剧是不可避免的。 与之类似的问题还有人口问题、污染问题以及军备竞赛问题。 小结 囚徒困境与公共地悲剧所反映的是个体的理性行为产生的集体的不合理性行为,体现了个体理性与集体理性的冲突。然而,当人类社会真的要产生如公共地悲剧这样的悲剧的时候,人们的价值观以及相应的社会制度会自动产生一种克服该悲剧的方法来。因而,悲剧并不是不可避免的。囚徒困境与公共地悲剧中的个体的理性是没有任何价值观约束下的理性,与实际中的情况相差甚远。 二、理性原则间的冲突 纽科姆难题是1960年由物理学家威廉·纽科姆提出的一个策略选择难题。它所反映的是理性人决策时的两个原则“最大期望效用原则”与“占优策略原则”之间的冲突。 纽科姆难题 因为神的预测是过去做出的,2号盒子里的钱数是不可更改的,与你现在的选择无关。所以,最后得到的钱数1000或1001000(由神的预测决定的)都将大于“只选2号盒子”得到的钱数0或1000000。 1. 根据占优策略原则得出的结果—取两个盒子 2.根据最大期望效用原则得出的结果—只取2号盒子 因为假定你选择“取两个盒子”,神已经预测到这一点,他使2号盒子里为0,你所得到的为1000;你“只取2号盒子”,神预测到这一点,那么神在2号盒子里放了1000000元,这样你所得到的为1000000元。选择“只取2号盒子”比“取两个盒子”的所得多999000元。所以,你应当选择“只取2号盒子”的策略。 小结 博弈论预设人可以“自由地”选择策略,即人的意志是自由的。然而在纽科姆难题中人的意志是否是自由的,则是一个问题。 如果神能够准确预测并做出正确的决定,表明在人的预测与人的决定之间存在着因果联系。此时,无论人做出什么样的决策,均是神的预测的实现; 如果人的意志是自由的,神的预测就难以准确。此时,人的理性便能够发挥作用。此时,人应当采用“混合策略”,即以一定的概率选择“取两个盒子”和“只取2号盒子”策略,概率各为0. 5。 三、过程理性与结果理性的冲突 动态博弈:是指博弈参与人的行动存在着先后次序, 并且后行动的参与人能够观察到前面的行动。 逆向归纳法:又称逆推法,是从动态博弈的最后一步往回推,以求解动态博弈的均衡结果。它是完全归纳推理,其推理是演绎的,结论是必然的。逆向归纳法是求解动态博弈均衡的方法。 1. 逆向归纳法与动态博弈 2.最后通牒博弈与蜈蚣博弈 A, B两个人分100元钱。规则规定:A提出方案,B对之进行表决。如果B对A提出的方案表示同意的话,A,B就按照A提出的方案进行分配,如果B不同意A的方案,那么A和B均将一无所有。这是一个完全且完美信息动态博弈。 (1)最后通牒博弈 结论 在这个例子中,我们看到,人的理性程度与其所得是呈反比关系的。在博弈论中理性人是努力使自己的收益最大的人,而在最后通碟博弈中,越理性的人得到的利益越低。 蜈蚣博弈也是动态博弈,所反映的问题被称为“逆向归纳法悖论”。 它是指这样一个博弈:两个参与者A、B轮流进行策略选择:可供选择的策略有“合作”与“不合作”两种。假定A先进行策略选择,然后是B,接着是A,如此交替进行。A、B之间的博弈的可能次数为有限次,比如198次。这个博弈的博弈树如下: 2.蜈蚣博弈 上图中,“c”表示“合作”策略,“nc”表
文档评论(0)