论推理权变理性基础与不同体系自洽性.docVIP

下载本文档

8
0
约7.54千字
约 16页
2018-05-26 发布于福建
举报
版权申诉

论推理权变理性基础与不同体系自洽性.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

论推理权变理性基础与不同体系自洽性

论推理权变理性基础与不同体系自洽性　　内容摘要：一直以来，蜈蚣博弈的基于逻辑(逆推归纳法)的推导结果和试验实践的结果存在很大的偏离，以往学者从两个角度对其原因进行了研究探讨，即“数理纠正”(以Aumann(1988)为代表)和直接否定逆推归纳法的作用(以Binmore和Bernard walliser(1996)为代表)。本文从一个新的角度――基于人的有限理性而提出的“权变理性”概念为基础，认为蜈蚣博弈的逻辑推导和试验实践，涉及两个独立的自洽的推理过程(绝对的理性和权变的理性)，从这个角度出发揭示了蜈蚣博弈之中“悖论”存在的根本原因，并且对这两个独立的推理过程进行比较。同时文章涉及到推理过程中的自我实现效应的讨论，强调重视常识和细节在博弈之中所起到的作用。　　关键词：蜈蚣博弈悖论　逆推归纳法权变理性　共同知识　　　　蜈蚣博弈的研究背景　　　　本文的关注点是1981年由罗森赛尔(Rosenthal)提出的一个动态博弈问题――“螟蚣博弈”(Centipede Game)。这个模型又被称为蜈蚣悖论(Centipede Paradox)，悖论产生于模型本身的逻辑严密性与现实决策过程偏离模型预测结果所产生的矛盾。蜈蚣博弈有不同版本(Rosenthal，1982；Megiddo，1986；Aumann，1988；Mc Kelvey＆Palfrey，1992)，而本文引用的则是最常见的一个，也就是罗森赛尔在1981年提出的。　　这个“螟蚣”模型试图模拟的是这样一种现实情况：两个合作者AB，当A发现B终将背叛自己，就会选择先下手为强以减小损失；而B发现A有此戒备，又会感到不安而进一步抢先行动；而A发现B居然对自己的戒备如此警惕，于是不得又进一步采取行动……猜疑的过程如此这般，反复不断。　　于是，对情况进行赋值：两个参与者A和B轮流进行策略选择，可供选择的策略有两种，“合作”与“不合作”。而规则包括：A、B两次决策为一组，第一次若A决策“不合作”，则博弈终止，A、B分别获得收益n。若A决策“台作”而B决策“不合作”，博弈也立即终止，但收益变为A获得n-1而B获得n+2。如果博弈在本次决策中并未终止，则下一轮博弈A、B的收益都从n+1开始。现在假定A首先进行决策，之后是B，然后交替进行。A，B间博弈次数设为198次，起始收益为1。那么，这个博弈就可以由决策树来表示(见图1)。　　　　在这个过程中涉及到的一种重要的思考方式，叫做“逆推归纳法”，也就是说，决策者着眼于博弈最终阶段的状态，并且根据最终阶段的状态来决定当下的行为。　　在图1中，如果用“逆推归纳法”来考察A是如何决策的话，就会发现A认为。在博奔的最后一步，即198步时了，B在“合作”与“不合作”之间选择时，肯定会选择“不合作”，因为根据博弈逻辑的一个基本假设，B是一个理性人，而“不合作”所带来的收益101大于“合作”带来的收益1 00。但是，要到198步就肯定要经过197步。而在197步时，考虑到B会在下一步选择“不合作”――到时A的收益为98，小于B在下一步选择“合作”时的100――那么A此时肯定会选择“不合作”，因为“不合作”的收益99要大于“合作”的收益98。以此类推，最后的结论是，蜈蚣博弈的纳什均衡为第一步A将选择“不合作”，各自的收益是1。　　从逻辑推理来看，逆推归纳法是严密的，第一步“合作”的策略是劣势策略。然而当我们引入实验者亲身参与的时候，却与逆推归纳的结果完全相反，很少会出现参与方A在第一轮就终止博弈的情况。通常而言，参与者也不会坚持合作到最后，而是终止于博弈过程中间偏后的某个不确定的位置上。　　这就产生了一个难题(paradox)：严密的逻辑推理的结论，却在单纯的模型试验层面(实验者按照模型给出的虚拟情境进行决策，并不涉及其它更复杂的考虑)遭到严峻的挑战。人们所做的选择，并不依照模型以其逻辑过程为依据的预测。　　对于这个悖论的经典解释，主要分成两类，其一，是Aumann等学者所做的“数理纠正”，也就是通过完善公理、定义和假设条件，以及推断结论的数学和逻辑结构(使模型更加自洽)，但是没有解决螟蚣悖论的现实与模型之间的实际冲突，而仅仅是将悖论排除出模型；其二，是Binmore和Bernard Walliser(1 996)等学者对“逆推归纳法”的否定，认为这种假设不符合人的现实认知，并且在进化博弈论之中找不到与逆推归纳法相近的进化方法或机制，因此，Binmore等学者认为逆推归纳法的价值和意义值得怀疑。　　从以上的两种相反的观点，我们可以看到，其中的一派从模型本身入手，可以实现自洽(自圆其说)；另一派则认为逆推归纳法本身是有问题的，两派争论不休。　　本文将从一个新的视角切入：在蜈蚣博弈的模型之中，逆推归纳法并