网站大量收购独家精品文档,联系QQ:2885784924

进化博弈模型中有限理性个体学习机制设计框架.pdfVIP

进化博弈模型中有限理性个体学习机制设计框架.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯 第 23卷第 9期 (总第 141期) 系 统 工 程 V0I.23,No.9 2005年 9月 SystemsEngineering Sept.,2005 文章编号 :1001-4098(2005)09—0016—04 进化博弈模型中有限理性个体学习机制设计框架 赵晗萍,冯允成,蒋家东 (北京航空航天大学 经济管理学院,北京 100083) 摘 要 :进化博弈突破 了传统博弈理论完全理性的限制 ,提 出了一种动态分析方法 ,模型中的动态产生的根源 就是个体的学习行为,因此学习机制 的设计是分析进化博弈 问题 的基础 。本文在划分决策过程 的基础上提 出 学习机制的设计框架 ,并针对不 同的决策阶段具体设计 了不 同的学习机制模型,为进一步研究进化博弈 问题 提供 了理论依据 。 关键词 :进化博弈;个体学习;有限理性 中图分类号 :F224 文献标识码 :A 在传统博弈论中都假设经济个体是 “完全理性”_ll的, 的过程 中,不断的进行学习和策略调整 ,从而分析演化过 所谓完全理性有两重含义 :一是理性决策者 ,意昧着决策 程是否具有稳定的均衡点,如何解释这个均衡点[4]。一个 者决策时利用了所有可利用的信息,选择最大化 自己的期 进化博弈模型 由以下要素组成 : 望收益 ;二是智能的,即每个人对别人行为 的预期都是正 (1)决策者 :来 自于一个或者多个独立群体的决策者 确的。进化博弈论则突破了这种限制,将决策者假设为有 i(=1,2,…,),这里不同群体中个体的行动空间与收益 限理性的,具有适应性学习能力 。但是进化博弈论早期 的 函数不同; 发展与应用来 自于生物学领域 ,因而强调大群体与选择动 (2)匹配规则:来 自于群体 中的个体的基本匹配方式 态的概念,个体的学习机制往往是模仿与强化这样幼稚的 有三种 :其一为单对模型,在每一阶段每个群体里只随机 方式,这与经济与社会系统中的个体的行为的复杂性不相 产生一个个体 ,这 n个个体进行固定的要素博弈;其二为 符 ,所 以进化博弈理论有两方面的议题值得继续探讨_l2], 随机匹配模型,群体所有 的个体与其他群体 的个体随机匹 首先是个体的学习机制能否产生选择动态;第二个是演化 配进行博弈;其三为总体模型,所有的个体都采取行动参 机制发挥作用的条件。也就是说需要在一个更加多样的条 与博弈,而每个决策者的收益有所有人的行动累积决定。 件下,对适应性学习的运作进行一个更详细深入的分析。 除此之外,因为经济或社会领域的问题更加灵活,所 以个 那么个体学习机制的设计就成为了关键点。 体 的匹配也可以是一对多或多对多; “学习”的定义是 由于经验而发生相对持久的行为改 (3)行动空间与收益函数 :每个群体 的决策者有 自己 变 3【]。也就是说,行为的变化说明了学习的发生。因此在进 行动空间A,以及与行动空间对应 的收益函数 ,(n 。)( 化博弈模型中学习的发生就体现在决策者在重复博弈过 由其他决策者的行动a-i产生的,一 表示决策者 以外的 程 中不断进行策略调整 。而决策者进行策略调整 的行为准 其他决策者); 则就是我们需要讨论 的学习模型,作者在第 2节 中简要介 (4)要素博弈:在时间周期 t(£=1,2,…)进行每一阶 绍 了进化博弈模型的组成要素 ;第 3节提出学习机制的设 段的要素博弈,博弈的战略式表达为G= {A ”,A 。, 计框架,进而在地 4节具体介绍了几种基本的学习机制, … , )。 最后第 5节通过实验将学习机制应用到囚徒困境 问题中。 2 学习机制框架

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档