第8章演化博弈论.ppt

下载文档

425
1
约1.76万字
约 94页
2018-02-28 发布于山东
举报
版权申诉
保障服务

第8章演化博弈论.ppt

1、本文档共94页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

梅纳德·史密斯（Maynard Smith）以鹰鸽博弈（hawk-dove game）开始，成为生物学讨论演化稳定性的标准模式。该博弈并不是表述老鹰和鸽子两种物种的个体之间对抗，而是同一物种中不同行为类型的个体间的竞争关系：人类作为一个种群，具有鹰派好斗（hawkish）和鸽派柔弱（dovish）的两面性，如图所示，争夺一种资源，其价值是v。如果鹰进攻而鸽默许，前者得到资源后者一无所获（v，0）。如果双方都进攻或都被动，则各方获得资源的机会均等。同时进攻，导致双方受伤，各自的成本为c, c v ,概率是1/2。上述即为单一种群的策略式要素博弈。种群的得益取决于选择鹰鸽策略分别在群体中所占的比例。 8.3.4 鹰鸽博弈的复制动态和演化稳定策略 , 0, v , v, 0 鹰博弈方2 鸽鹰鸽博弈方 1 鹰鸽博弈伊拉克战争期间拉姆斯菲尔德为首的鹰派和鲍威尔为首的鸽派之间的分歧复制动态方程和相位图 dx/dt x 1 1/6 8.3复制动态和演化稳定性：两人非对称博弈 8.3.1 市场阻入博弈的复制动态和演化稳定策略 8.3.2 非对称鹰鸽博弈的演化分析如果一个群体中成员之间的地位不一样，那么博弈方之间进行就是非对称博弈。非对称博弈是用两个（或多个）有差别的有限理性博弈方群体的成员，相互之间随机配对博弈。以市场阻入博弈为例（如图4，表6）。 1 2 （0，0）（2，2）（1，5）进入不进打击容忍 2 打击容忍 1 进入 0, 0 2, 2 不进 1, 5 1, 5 8.3.1 市场阻入博弈的复制动态和演化稳定策略由于是非对称博弈，问题中实际上有两个不同的博弈方，博弈方1是潜在的进入者，博弈方2是阻入者，每次博弈实际都是前一群体的一个成员与后一群体的一个成员进行的。分析框架：反复在两个群体中各随机抽取一个成员配对进行。博弈方的学习和策略模仿局限在他们所在群体内部，策略调整的机制仍然是与对称博弈中相似的复制动态。分别对两个群体成员进行复制动态和演化稳定策略分析。假设博弈方1中，采用“进入”策略的占的比例为x；在博弈方2中，采用“打击”策略的占的比例为y。 1 2 进入不进打击不打（0，0）（2，2）（1，5）（1）博弈方1的收益计算（2）博弈方2的收益计算博弈方1位置博弈群体复制动态相位图 x dx/dt 1 y1/2 x dx/dt 1 y1/2 dx/dt x 1 y=1/2 博弈方2位置博弈群体复制动态相位图 x dy/dt 1 x = 0 x dy/dt 1 x = 0 8.3.2 非对称鹰鸽博弈的演化分析鹰博弈方 1 鸽鹰博弈方2 鸽非对称鹰鸽博弈博弈方1群体复制动态相位图 x dx/dt 1 y5/6 x dx/dt 1 y5/6 x dx/dt 1 y=5/6 非对称鹰鸽博弈博弈方2群体复制动态相位图 y dy/dt 1 x1/6 y dy/dt 1 x1/6 y dy/dt 1 x=1/6 青木昌彦《经济体制变迁的演化分析》、《比较制度分析》； Fudenberg Levine，“The Theory of Learning in Games”《博弈学习理论》； W. Weibull，“Evolutionary Game Theory”《演化博弈论》理论介绍性的外文文献： D. Fudenberg, “On economic applications of evolutionary game theory” Journal of Evolutionary Economics, (1998)8:15-43. 范如国《博弈论》，武汉大学出版社，2011 8.4主要中文翻译的参考书目 * * 一般的演化博弈模型的建立主要基于两个方面：选择(Selection)和突变(Mutation)。选择是指能够获得较高支付的策略在以后将被更多的参与者采用；突变是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的策略，也可能是获得较低支付的策略)。突变其实也是一种选择，但只有好的策略才能生存下来。突变是一种不断试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是不断改进的。不具备这两个方面的模型不能称为演化博弈模型。演化博弈的基本分析过程： * 群体（populations）：生物系统或社会经济系统中存在着许多参与者，可以分为同类群体和不同类群体， k?1 。每个群体都有自己的行动集合。支付函数(pay off function)：某种行动对应的收益。对于策略式博弈表示的要素博弈，又称为适应度函数(fitness function