- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯
第 23卷第 9期 (总第 141期) 系 统 工 程 V0I.23,No.9
2005年 9月 SystemsEngineering Sept.,2005
文章编号 :1001-4098(2005)09—0016—04
进化博弈模型中有限理性个体学习机制设计框架
赵晗萍,冯允成,蒋家东
(北京航空航天大学 经济管理学院,北京 100083)
摘 要 :进化博弈突破 了传统博弈理论完全理性的限制 ,提 出了一种动态分析方法 ,模型中的动态产生的根源
就是个体的学习行为,因此学习机制 的设计是分析进化博弈 问题 的基础 。本文在划分决策过程 的基础上提 出
学习机制的设计框架 ,并针对不 同的决策阶段具体设计 了不 同的学习机制模型,为进一步研究进化博弈 问题
提供 了理论依据 。
关键词 :进化博弈;个体学习;有限理性
中图分类号 :F224 文献标识码 :A
在传统博弈论中都假设经济个体是 “完全理性”_ll的, 的过程 中,不断的进行学习和策略调整 ,从而分析演化过
所谓完全理性有两重含义 :一是理性决策者 ,意昧着决策 程是否具有稳定的均衡点,如何解释这个均衡点[4]。一个
者决策时利用了所有可利用的信息,选择最大化 自己的期 进化博弈模型 由以下要素组成 :
望收益 ;二是智能的,即每个人对别人行为 的预期都是正 (1)决策者 :来 自于一个或者多个独立群体的决策者
确的。进化博弈论则突破了这种限制,将决策者假设为有 i(=1,2,…,),这里不同群体中个体的行动空间与收益
限理性的,具有适应性学习能力 。但是进化博弈论早期 的 函数不同;
发展与应用来 自于生物学领域 ,因而强调大群体与选择动 (2)匹配规则:来 自于群体 中的个体的基本匹配方式
态的概念,个体的学习机制往往是模仿与强化这样幼稚的 有三种 :其一为单对模型,在每一阶段每个群体里只随机
方式,这与经济与社会系统中的个体的行为的复杂性不相 产生一个个体 ,这 n个个体进行固定的要素博弈;其二为
符 ,所 以进化博弈理论有两方面的议题值得继续探讨_l2], 随机匹配模型,群体所有 的个体与其他群体 的个体随机匹
首先是个体的学习机制能否产生选择动态;第二个是演化 配进行博弈;其三为总体模型,所有的个体都采取行动参
机制发挥作用的条件。也就是说需要在一个更加多样的条 与博弈,而每个决策者的收益有所有人的行动累积决定。
件下,对适应性学习的运作进行一个更详细深入的分析。 除此之外,因为经济或社会领域的问题更加灵活,所 以个
那么个体学习机制的设计就成为了关键点。 体 的匹配也可以是一对多或多对多;
“学习”的定义是 由于经验而发生相对持久的行为改 (3)行动空间与收益函数 :每个群体 的决策者有 自己
变 3【]。也就是说,行为的变化说明了学习的发生。因此在进 行动空间A,以及与行动空间对应 的收益函数 ,(n 。)(
化博弈模型中学习的发生就体现在决策者在重复博弈过 由其他决策者的行动a-i产生的,一 表示决策者 以外的
程 中不断进行策略调整 。而决策者进行策略调整 的行为准 其他决策者);
则就是我们需要讨论 的学习模型,作者在第 2节 中简要介 (4)要素博弈:在时间周期 t(£=1,2,…)进行每一阶
绍 了进化博弈模型的组成要素 ;第 3节提出学习机制的设 段的要素博弈,博弈的战略式表达为G= {A ”,A 。,
计框架,进而在地 4节具体介绍了几种基本的学习机制, … , )。
最后第 5节通过实验将学习机制应用到囚徒困境 问题中。
2 学习机制框架
您可能关注的文档
最近下载
- 00401比较学前教育复习提纲(2015年版-修改版).doc
- 肠肿瘤和肠息肉-外科学课件.ppt
- 可视化人力资源分析看板.xlsx VIP
- CB01_012 多头小直径防渗墙施工方案.doc
- 人力资源看板.xlsx VIP
- 第10课 保存信息资源 课件 义务教育版2024信息科技三年级全一册.pptx
- 2024年-人教版PEP小学英语六年级下册人教版pep小学六年级英语下册第一单元测试题Unit 1.docx VIP
- 第6课 隋唐时期的中外文化交流(课件)2024-2025学年 历史同步教学课件.pptx VIP
- 糖尿病患者血脂管理中国专家共识2024版.pptx
- 《建筑节能与可再生能源利用通用规范》GB-55015-2021.pdf VIP
文档评论(0)