网站大量收购闲置独家精品文档,联系QQ:2885784924

第七章有限理性和演进博弈.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 有限理性和进化博弈 进化博弈分析是有限理性博弈分析的基本框架。 本章介绍以最优反应动态和复制动态为核心 以进化稳定策略为基本均衡概念的进化博弈分析,包括基本方法、概念和各种经典模型等。 有限理性和进化博弈 进化博弈分析是有限理性博弈分析的基本框架。 本章介绍以最优反应动态和复制动态为核心,以进化稳定策略为基本均衡概念的进化博弈分析 包括基本方法、概念和各种经典模型等。 本章分四节 7.1有限理性博弈及其分析框架 7.2最优反应动态 7.3复制动态和进化稳定性: 两人对称博弈 7.4复制动态和进化稳定性: 两人非对称博弈 7.1 有限理性博弈及其分析框架 7.1.1 有限理性及其对博弈的影响 7.1.2 有限理性博弈分析框架 完全理性 理性意识 分析推理能力 识别判断能力 记忆能力 准确行为能力 在学习中成长 完全理性的条件有任意一条不成立,即为有限理性 警察和犯人的游戏 做数学题 打碎花瓶 人类社会历史发展 7.1.1 有限理性及其对博弈的影响 有限理性玩家:不满足完全理性假设的玩家 有限理性意味着一般至少有部分玩家不会采用完全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离 有限理性玩家会在博弈过程中学习博弈通过试错寻找较好的策略 7.1.2 有限理性博弈分析框架 均衡状态:通过玩家模仿、学习、调整达到。 往往要通过重复博弈实现 假设所有玩家都是爱学习的好孩子 7.1.2 有限理性博弈分析框架 最优反应动态:有快速学习能力的小群体成员的反复博弈 复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈 进化稳定策略(Evolutionary Stable Strategy, Abre:ESS) ESS 人类有限理性博弈可以用生物进化的动态机制来模拟 人类的理性层次相对其他动物来比较高 社会发展在线性提高中无法避免误差 7.2 最优反应动态 7.2.1 协调博弈的有限玩家 快速学习模型 7.2.2 古诺调整过程 7.2.1 协调博弈的有限玩家快速学习模型 模型: 7.2.1 协调博弈的有限玩家快速学习模型 上图的协调模型存在两个纳什均衡 完全理性的预测结果是 风险上策均衡是 由于现实中博弈方的理性有限,那么我们可以在有限理性的基础上来分析问题 快速学习 假设有5个玩家,则初次博弈策略集合总共有32策略 假设玩家不对称,则存在32种可选策略 假设Xi(t)为t时间玩家i的邻居中采用A策略的数量。该数量有0,1,2三种可能值 采取B策略的数量为2-Xi(t) 反应、策略调整规则推导 反应规则 t时期玩家的邻居中只要有一个采用A,则玩家会在t+1时采用A 如果两个邻居都没有采用A,则玩家在t+1时采用B 玩家t+1时的决策和t时的决策没有直接关系 几种情况 玩家在都是选择A或者B的时候 上述假设具有稳定性,已经是均衡状态 当同时存在A和B时,存在对均衡结果的具体考量 在其他情况下,均衡状态是收敛还是发散呢? 最优反应动态模拟:初次博弈1个A 思考 2个不相邻的A 3个不相邻的A 4个不相邻的A 初次博弈相连3个A 进化稳定策略 博弈存在两个均衡状态 有一种情况 其他31种情况 当玩家理性有限时,博弈方采取A,大大高于采取B的均衡博弈在(A,A)时达到稳定收敛,我们称A为进化稳定策略 问:存在其他情况的均衡吗? 7.2.2 古诺调整过程 回忆古诺模型 两个没有预见能力的有限理性玩家反复博弈 古诺调整是一个典型的例子 假设寡头通过外推和学习不断调整自己的产量 每方选择的产量都是对对手上一期产量的最佳反应 7.2.2 古诺调整过程 双方都是有限理性 知道自己的反应函数 不知道对方的利润和反映函数 没有预见能力 7.2.2 古诺调整过程 古诺模型反应函数 7.2.2 古诺动态调整过程 古诺模型动态反应函数 7.3 复制动态和进化稳定性: 两人对称博弈 7.3.1 签协议博弈的复制动态和进化稳定策略 玩家学习速度慢 向优势策略转变是一个渐进的过程 不是所有玩家同时调整 策略调整速度可以用生物进化的动态方程——复制动态公式表示 签协议的博弈 假设博弈是静态的 两个纯策略纳什均衡 前一个均衡帕累托优于另一个 完全理性博弈,结果是 如果理性有限,则有完全不同的结果 7.3.1 签协议博弈的复制动态和进化稳定策略 理性层次较低 大群体成员随机配对反复博弈 假设整个群体中同意比例为x,则不同意的比例为1-x 根据统计数据和策略收益计算预期 7.3.1 签协议博弈的复制动态和进化稳定策略 签协议博弈: 理性水平低吃亏啊 除非x=0,否则两类玩家收益有显著差别 同意类型收益高于不同意类型,也高于平均值 收益较差的玩家迟早会发现

文档评论(0)

haocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档