进化博弈模型中有限理性个体学习机制设计框架.pdfVIP

下载本文档

8
0
约1.23万字
约 4页
2015-08-27 发布于安徽
举报
版权申诉

进化博弈模型中有限理性个体学习机制设计框架.pdf

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

维普资讯第 23卷第 9期 (总第 141期) 系统工程 V0I．23，No．9 2005年 9月 SystemsEngineering Sept．，2005 文章编号：1001-4098(2005)09—0016—04 进化博弈模型中有限理性个体学习机制设计框架赵晗萍，冯允成，蒋家东 (北京航空航天大学经济管理学院，北京 100083) 摘要：进化博弈突破了传统博弈理论完全理性的限制，提出了一种动态分析方法，模型中的动态产生的根源就是个体的学习行为，因此学习机制的设计是分析进化博弈问题的基础。本文在划分决策过程的基础上提出学习机制的设计框架，并针对不同的决策阶段具体设计了不同的学习机制模型，为进一步研究进化博弈问题提供了理论依据。关键词：进化博弈；个体学习；有限理性中图分类号：F224 文献标识码：A 在传统博弈论中都假设经济个体是 “完全理性”_ll的，的过程中，不断的进行学习和策略调整，从而分析演化过所谓完全理性有两重含义：一是理性决策者，意昧着决策程是否具有稳定的均衡点，如何解释这个均衡点[4]。一个者决策时利用了所有可利用的信息，选择最大化自己的期进化博弈模型由以下要素组成：望收益；二是智能的，即每个人对别人行为的预期都是正 (1)决策者：来自于一个或者多个独立群体的决策者确的。进化博弈论则突破了这种限制，将决策者假设为有 i(=1，2，…，)，这里不同群体中个体的行动空间与收益限理性的，具有适应性学习能力。但是进化博弈论早期的函数不同；发展与应用来自于生物学领域，因而强调大群体与选择动 (2)匹配规则：来自于群体中的个体的基本匹配方式态的概念，个体的学习机制往往是模仿与强化这样幼稚的有三种：其一为单对模型，在每一阶段每个群体里只随机方式，这与经济与社会系统中的个体的行为的复杂性不相产生一个个体，这 n个个体进行固定的要素博弈；其二为符，所以进化博弈理论有两方面的议题值得继续探讨_l2]，随机匹配模型，群体所有的个体与其他群体的个体随机匹首先是个体的学习机制能否产生选择动态；第二个是演化配进行博弈；其三为总体模型，所有的个体都采取行动参机制发挥作用的条件。也就是说需要在一个更加多样的条与博弈，而每个决策者的收益有所有人的行动累积决定。件下，对适应性学习的运作进行一个更详细深入的分析。除此之外，因为经济或社会领域的问题更加灵活，所以个那么个体学习机制的设计就成为了关键点。体的匹配也可以是一对多或多对多； “学习”的定义是由于经验而发生相对持久的行为改 (3)行动空间与收益函数：每个群体的决策者有自己变 3【]。也就是说，行为的变化说明了学习的发生。因此在进行动空间A，以及与行动空间对应的收益函数，(n 。)( 化博弈模型中学习的发生就体现在决策者在重复博弈过由其他决策者的行动a-i产生的，一表示决策者以外的程中不断进行策略调整。而决策者进行策略调整的行为准其他决策者)；则就是我们需要讨论的学习模型，作者在第 2节中简要介 (4)要素博弈：在时间周期 t(￡=1，2，…)进行每一阶绍了进化博弈模型的组成要素；第 3节提出学习机制的设段的要素博弈，博弈的战略式表达为G= {A ”，A 。，计框架，进而在地 4节具体介绍了几种基本的学习机制， … ， )。最后第 5节通过实验将学习机制应用到囚徒困境问题中。 2 学习机制框架