- 20
- 0
- 约5.64千字
- 约 54页
- 2019-07-22 发布于福建
- 举报
第八讲 有限理性和进化博弈;有限理性博弈及其分析框架
最优反应动态
复制动态和进化稳定性:两人对称博弈
复制动态和进化稳定性:两人非对称博弈;有限理性:追求最大利益的理性意识,分析推理能力,识别判断能力,记忆能力和准确行为能力等多方面的要求有任何一方面的不完美即为有限理性
有限理性的非唯一性:博弈方有限理性的层次及各方面能力的侧重存在差异
有限理性博弈:至少有部分博弈方具有有限理性;博弈方有限理性对博弈的影响
博弈方不会一开始就找到最优策略,会在博弈过程中学习博弈,必须通过试错来寻找较好的策略;也意味着至少有部分博弈方不会采用完全理性博弈的均衡策略,均衡是不断调整和改进而不是一次性选择的结果,而且即使达到均衡也有可能再次偏离
;8.1.2 有限理性博弈分析框架;进化博弈分析的关键
确定博弈的分析框架,即博弈方学习和策略调整的模式或机制以及相互学习、模仿的环境条件。
主要讨论两种动态机制
有快速学习能力的小群体成员的反复博弈。
——最优反应动态
学习速度很慢的成员组成的大群体随机配对的反复博弈。
——生物进化的 “复制动态”机制
;8.2 最优反应动态;8.2.1 协调博弈的有限博弈方快速学习模型;确定分析框架
博弈方虽缺乏预见能力但能够对上一阶段博弈结果进行总结,作出策略调整
设 5 个博弈方分别处于下图所示圆周中的 5个位置上,每个博弈方都与左右相邻的博弈方反复博弈
;每个位置的博弈方既可能采用 A 也可能采用 B,总共有 种可能,包括全部采用 A,全采用 B 和两种策略都有人采用。根据采用 A 博弈方的数量和分布,总共有 无A,1A、有相邻2A、有不相邻 2A、有3连A、有非3连A、4A、5A共 8 种有实质差异
;
设 为 时期博弈方 的邻居中采用 A策略邻居的数量 则采用 B 策略邻居的数量相应 根据第 期的相关情况博弈方 采用 A 的得益为
,采用B的得益为
根据动态反应机制
当 即 时
博弈方 在 时期会采用 A
当 即 时
博弈方 在 时期会采用 B ;
反应规则:如在 时期博弈方 的两个邻居只要有 1个采用 A,则在 时期采用 A,两个邻居都没采用 A,则在 时期采用 B。博弈方 在 时期的策略与自己在 时期采用的策略无关
5 个博弈方完全相似,除了初次博弈时所有博弈方都采用 B 的情况外,从其余情况出发,经最优反应动态法则的调整,最终都会收敛到所有博弈方都采用 A 的稳定状态。分析过程如下;全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方数量和位置有实质差异的只有 6 种情况;初次博弈为相连 3A 的最优反应动态;进化稳定策略
在博弈方的动态调整策略中能达到,又对少量偏离的扰动有稳健性,满足这两种性质的稳定状态称“进化稳定策略”(ESS)
分析现实问题,必须根据实际情况建立分析框架;8.2.2 古诺调整过程;分析过程
若寡头 1 生产 2.5 单位,寡头 2 生产 3 单位。第一期结束后将这两个产量分别带入寡头 1、2 的反应函数,得到第二期的产量 1.5 和 1.75 单位;如此类推,动态调整过程将趋向于两寡头各生产 2 个单位。这个稳定状态具有对微小扰动的稳健性,是一个进化稳定策略。
注意收敛是有条件的,
分析的逻辑基础不同,则构成不同的动态机制。;8.3.1 签协议博弈的复制动态和进化稳定策略;经济活动中的各种合作都可以用签协议来代表,以右图所示的签协议博弈为例:
根据该博弈的得益情况,有两个纯策略纳什均衡,
(同意,同意)
(不同意,不同意)
前者帕累托优于后者,在理性层次较低的有限理性博弈方组成的大群体成员随机配对反复博弈的框架内分析该博弈;分析过程
博弈方理性较低,不会一开始就找到最佳策略。不同策略的博弈方可看作不同的类型。假设,整个群体中为“同意”类型的博弈方占整个群体的
原创力文档

文档评论(0)