第七章有限理性和演进博弈.ppt

下载文档 降价啦

11
0
约 64页
2017-02-07 发布于重庆
举报
版权申诉
保障服务

第七章有限理性和演进博弈.ppt

1、本文档共64页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第七章有限理性和进化博弈进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心以进化稳定策略为基本均衡概念的进化博弈分析，包括基本方法、概念和各种经典模型等。有限理性和进化博弈进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心，以进化稳定策略为基本均衡概念的进化博弈分析包括基本方法、概念和各种经典模型等。本章分四节 7.1有限理性博弈及其分析框架 7.2最优反应动态 7.3复制动态和进化稳定性：两人对称博弈 7.4复制动态和进化稳定性：两人非对称博弈 7.1 有限理性博弈及其分析框架 7.1.1 有限理性及其对博弈的影响 7.1.2 有限理性博弈分析框架完全理性理性意识分析推理能力识别判断能力记忆能力准确行为能力在学习中成长完全理性的条件有任意一条不成立，即为有限理性警察和犯人的游戏做数学题打碎花瓶人类社会历史发展 7.1.1 有限理性及其对博弈的影响有限理性玩家：不满足完全理性假设的玩家有限理性意味着一般至少有部分玩家不会采用完全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次性选择的结果，而且即使到达了均衡也可能再次偏离有限理性玩家会在博弈过程中学习博弈通过试错寻找较好的策略 7.1.2 有限理性博弈分析框架均衡状态：通过玩家模仿、学习、调整达到。往往要通过重复博弈实现假设所有玩家都是爱学习的好孩子 7.1.2 有限理性博弈分析框架最优反应动态：有快速学习能力的小群体成员的反复博弈复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略（Evolutionary Stable Strategy, Abre:ESS） ESS 人类有限理性博弈可以用生物进化的动态机制来模拟人类的理性层次相对其他动物来比较高社会发展在线性提高中无法避免误差 7.2 最优反应动态 7.2.1 协调博弈的有限玩家快速学习模型 7.2.2 古诺调整过程 7.2.1 协调博弈的有限玩家快速学习模型模型： 7.2.1 协调博弈的有限玩家快速学习模型上图的协调模型存在两个纳什均衡完全理性的预测结果是风险上策均衡是由于现实中博弈方的理性有限，那么我们可以在有限理性的基础上来分析问题快速学习假设有5个玩家，则初次博弈策略集合总共有32策略假设玩家不对称，则存在32种可选策略假设Xi(t)为t时间玩家i的邻居中采用A策略的数量。该数量有0,1,2三种可能值采取B策略的数量为2-Xi(t) 反应、策略调整规则推导反应规则 t时期玩家的邻居中只要有一个采用A，则玩家会在t+1时采用A 如果两个邻居都没有采用A，则玩家在t+1时采用B 玩家t+1时的决策和t时的决策没有直接关系几种情况玩家在都是选择A或者B的时候上述假设具有稳定性，已经是均衡状态当同时存在A和B时，存在对均衡结果的具体考量在其他情况下，均衡状态是收敛还是发散呢？最优反应动态模拟：初次博弈1个A 思考 2个不相邻的A 3个不相邻的A 4个不相邻的A 初次博弈相连3个A 进化稳定策略博弈存在两个均衡状态有一种情况其他31种情况当玩家理性有限时，博弈方采取A，大大高于采取B的均衡博弈在(A,A)时达到稳定收敛，我们称A为进化稳定策略问：存在其他情况的均衡吗？ 7.2.2 古诺调整过程回忆古诺模型两个没有预见能力的有限理性玩家反复博弈古诺调整是一个典型的例子假设寡头通过外推和学习不断调整自己的产量每方选择的产量都是对对手上一期产量的最佳反应 7.2.2 古诺调整过程双方都是有限理性知道自己的反应函数不知道对方的利润和反映函数没有预见能力 7.2.2 古诺调整过程古诺模型反应函数 7.2.2 古诺动态调整过程古诺模型动态反应函数 7.3 复制动态和进化稳定性：两人对称博弈 7.3.1 签协议博弈的复制动态和进化稳定策略玩家学习速度慢向优势策略转变是一个渐进的过程不是所有玩家同时调整策略调整速度可以用生物进化的动态方程——复制动态公式表示签协议的博弈假设博弈是静态的两个纯策略纳什均衡前一个均衡帕累托优于另一个完全理性博弈，结果是如果理性有限，则有完全不同的结果 7.3.1 签协议博弈的复制动态和进化稳定策略理性层次较低大群体成员随机配对反复博弈假设整个群体中同意比例为x，则不同意的比例为1-x 根据统计数据和策略收益计算预期 7.3.1 签协议博弈的复制动态和进化稳定策略签协议博弈：理性水平低吃亏啊除非x=0，否则两类玩家收益有显著差别同意类型收益高于不同意类型，也高于平均值收益较差的玩家迟早会发现