论人类决策过程的进化模型行政.docVIP

下载本文档

1
0
约1.24万字
约 11页
2016-01-22 发布于北京
举报
版权申诉

论人类决策过程的进化模型行政.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

论人类决策过程的进化模型行政.doc

论人类决策过程的进化模型行政论文范文大全论人类决策过程的进化模型摘要人既不同于简单的生物也不同于传统经济学所假定的完全理性经济人，而是具有逻辑推理能力的高等智能生物。现实中参与人是有限理性的，因而，其决策过程既不能利用简单的模仿者动态所能准确描述的，也不能完全依赖于最优化计算，人类实际的决策过程是一个复杂的模仿、学习的渐进过程。本文主要论述学术界对人类实际决策过程研究成果，重点分析了两类学习模型即支付强化学习模型及信念强化学习模型，并对后两类模型在预测参与人决策的效果进行了比较。关键词：最优化，模仿者动态，支付强化模型，信念强化模型引言传统经济学建立于完全信息、理性人等假定基础上，此时参与人就相当于功能良好的计算机，无论环境发生任何变化，理性人在既定信息下总可以找到一条达到均衡的最优路径，所以传统理论根本不必考虑达到均衡的路径，不必分析人类的决策过程，只需应用比较静态法来研究均衡之间的关系。然而，现实中参与人并不满足完全理性要求，信息也不可能免费获得，参与人在多数情况下并不可能进行最优化计算。心理学家西蒙(simon)认为考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为受到其所处的社会环境、过去的经验、日常惯例等因素的影响，参与人只可能采取模仿、学习等直观方法来进行决策。进化博弈理论从西蒙的“有限理性”出发，以群体为研究对象来研究参与人的实际决策过程，参与人的决策过程受到各种各样因素的影响，为了得到更加准确的决策结果他们就必须收集、处理这些信息，这种信息的收集与处理过程就是参与人的学习过程。经济学家借用进化博弈理论的研究方法来研究参与人的决策过程时，主要从二个方面来提出动态模型的：一是直接借用描述生态现象的模仿者动态模型来分析简单的决策过程；另一是描述具有逻辑思维及推理能力的参与人复杂的学习模型。一、模仿者动态模型进化博弈理论来源于对生态现象的研究，它的产生至少可以追溯到1960年代生态学家lewontin用于解释生态现象，被经济学家应用它来研究人类行为却只有近十几年的时间。进化博弈理论的基本均衡概念----进化稳定策略是由maynard smith and price（1973）在研究生态现象时提出来的，该概念的提出标志着进化博弈理论的产生。其基本思想是群体处于一种能够承受外部任何小突变因素影响而不偏离的状态就是进化稳定状态，其中小突变因素即是指存在一个与稳定状态有关的突变边界，当突变因素不超过这个边界时，系统就不会偏离原状态。进化稳定策略概念中由于引进了突变因素而较静态的纳什均衡概念更好地解释现实现象，并且较好地解决了经典博弈理论中棘手的均衡选择问题。进化稳定策略是一个可以描述系统的局部动态性质的静态概念，即系统一旦进化稳定策略的吸引域，除非足够大的突变冲击，否则系统就不会离开稳定状态，也就是说该均衡概念并没有考虑到吸引域之外的变化。因此，要更全面地考察系统的行为就必须考察系统是如何达到吸引域的，即必须分析系统对动态过程。动态概念在进化博弈理论中占有相当重要的地位，许多进化博弈理论家从不同的侧面对生态演化及参与人的决策过程进行了考察并提出了许多动态模型，其中最重要的动态模型就是由taylor and jonker(1978) 在研究生态演化现象时提出的模仿者动态模型（replicator dynamics model），详细讨论可以参阅文献。生态学家在研究生态演化现象时，常常把同一生态环境中所有种群看作为一个大群体而把其中的每一个种群都程式化单个纯策略，个体之间随机配对且进行重复、匿名博弈；个体在博弈中所得的支付即适应度是用其后代数量来表示的；假定个体是无性繁殖，即每一个后代都继承其单亲的策略；更成功的种群其后代数在群体中所占的比例变得越来越高而更不成功的种群体后代数会变得越来越低。模仿者动态模型是在考察生态现象时提出来的，它能够较好描述生态演化的动态过程，借用模仿者动态模型来描述参与人复杂的决策过程就需要作出相应的转换。因为，在不考虑突变的情况下，生物行为一般是由其基因完全决定，种群演化过程遵循简单的适者生存不适者淘汰规律，模仿者动态模型在描述生物演化行为时获得了巨大的成功，这种简单的演化动态用于描述参与人的行为时就显示出了局限性。首先，人是具有思维能力、推理能力的高级智能生物，其行为方式远比其他生物复杂，人的行为不仅受到其先天性遗传基因的影响，更重要的是受到后天学习因素的影响。因此，由简单的模仿者动态难以描述参与人复杂的决策过程。其次，由适应度而引致的动态过程是通过种群后代数的变化而调整的，也就是说更成功的策略者会得到更多的后代，这就隐含了频率的调整是一个自动过程，群体