第四章 进化博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.1 有限理性与进化博弈论 然而,完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。 4.1.1 进化博弈的基础假设——有限理性 传统的博弈均衡,例如Nash均衡及其精炼是以完全理性都是共同知识(common knowledge)为前提的。 第四章 进化博弈论 4.1.2 有限理性及其对博弈的影响 有限理性局中人:不满足完全理性假设的局中人 有限理性意味着一般至少有部分局中人不会采用完全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离 有限理性局中人会在博弈过程中学习博弈通过试错寻找较好的策略 4.1.3 合作的行为生态 动物的适应性是在和生存环境的相互作用中形成的。 在竞争中,动物最终选择进化稳定策略(Evolutionary Stable Strategy,简称ESS)——该策略是被种群大多数成员所采取的,而且不会受到其它对策的侵蚀。 一种ESS一旦确立,社会稳定下来,偏离的行为将会受到自然的惩罚。 有利它主义和合作行为在动物界普遍存在。该行为也可能发生在没有亲缘关系的情况:如共生现象。 在有限理性博弈中具有真正稳定性和 较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习的调整过程达到的,具有能经受错误偏离的干扰 的均衡,是在受到少量干扰后仍然能够“恢复”的均衡。 4.1.4 有 限 理 性 博 弈 的 分 析 框 架 4.1.4 有 限 理 性 博 弈 的 分 析 框 架 最优反应动态:有快速学习能力的小群体成员的反复博弈 复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈 进化稳定策略(ESS) 4.2 最优反应动态 4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程 4.2.1 协调博弈的有限博弈方快速学习模型 1 2 3 4 5 两个NASH均衡,但考虑到对对方理性的信任问题,风险态度等因素,可能选(A,A)。 考虑5个有限理性的局中人之间,相邻局中人相互博弈,快速学习并动态调整。 局中人 1 局中人2 A B A 50,50 49,0 B 0,49 60,60 反应、策略调整规则推导 局中人 1 局中人2 A B A 50,50 49,0 B 0,49 60,60 最优反应动态模拟:初次博弈1个A A B A B A B A B B B A A A A A B A A A A B A A B B 初次博弈相邻2个A A A A A A A A B A A B B B A A 初次博弈相连3个A B A A B A A A A A A 5.2.2 古诺调整过程 古诺模型反应函数 1 2 3 4……… 博弈方1 2.5 1.5 2.125 1.875 博弈方2 3 1.75 2.25 1.9375 问题:两寡头始终假设对方产量不变 最优反应动态模拟 收敛条件 4. 3 复制动态和进化稳定性: 两人对称博弈 设某一群体进行随机配对重复博弈,且该博弈为对称博弈,即群体中个体无角色区分,所有个体均具有相同的战略空间。 这时博弈分析的核心不是博弈方的最优策略的选择,而是有限理性的博弈方组成的群体成员的策略调整过程、趋势和稳定性,这里的稳定性是指采用特定策略的成员的比例不变,而非某个博弈方的策略不变。 引例: 签协议博弈的复制动态和进化稳定策略 签协议博弈: 1,1 0,0 0,0 0,0 同意(y) 局中人2 不同意(n) 同意(y) 不同意(n) 局 中 人 1 在有限理性的前提下,并非所有的局中人开始就能找到最佳策略(y, y)。下面分析(y, y)是ESS。 假设群体中采用“同意”比例为 x ,则不同策略期望得益和总平均得益为: 所以,除x=0外,有: 在不断的重复博弈过程中,只要局中人有基本的判断能力,早晚会发现该差异。于是,得益较差的局中人会或早或迟模仿另一方。 这意味着两种类型局中人的比例x和1-x不是固定不变的,而是时间的函数: x(t)和1-x (t)。 局中人策略类型比例的动态变化是进化博弈分析的核心。 上述比例动态变化的速度取决于模仿的速度。该速度取决于两个因素: (1)被模仿

文档评论(0)

jyf123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6153235235000003

1亿VIP精品文档

相关文档