进化稳定策略及其应用-精品·公开课件.ppt

进化稳定策略及其应用-精品·公开课件.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例如,一个雄性粪蝇在寻觅雌蝇时的最优占位往往取决于其它雄蝇停落在什么位置;在争夺配偶的战斗中,一个雄性动物的最佳对策经常取决于他的对手如何行动,有时退让是有利的,有时激烈争斗是更适合的。在这些例子中,不存在一个任何情形下都一律适用的最佳对策。这时我们观察到的自然界生物它们应该采取何种对策呢?为解决这一难题,Maynard Smith(1982;Maynard Smith Price 1973)创造性地提出了一个全新概念––进化稳定对策,或称ESS(为英文全称evolutionarily stable strategy的简写)。当种群内所有个体都采取了某个对策后,其它对策者都不能侵入该种群,那么这个对策就是进化上稳定的。这个概念不强调绝对意义上的优化,而是从相对意义上寻求所谓的最佳:当种群完全是由ESS对策者组成的时候,ESS对策者的适合度将大于所有突变对策者的适合度。因而,ESS是一个弱化了的最优化概念(Ehrlich Roughgarden 1987)。 单态ESS 定义 对所有不同于S*的个体策略S,如果有 E(S*, S*)=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)E(S,S) 那么,称S*为单态ESS 在单种群进化博弈中,ESS是对称纳什均衡,但对称纳什均衡不一定是ESS。(交换经济博弈) 经济交换博弈 (L,L)不是单态ESS。策略L用S*=(1,0)表示,策略H用S=(0,1)表示 E(S*, S*)=(1,0) =1 E(S ,S*)=1= E(S*, S*) 而 E(S*, S)= =12=E(S,S) 所以策略L不是单态ESS 多态ESS(对于有多个个人策略) 定义 对所有不同于S*的S m,如果有 E(S*, S*)=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)E(S,S) 那么,称S*为一个ESS。 设A= 为进化博弈的行为参与人的支付矩阵,如果存在 使 , 则第 个策略 是进化稳定策略 严格对称的纳什均衡是进化稳定策略,但是进化稳定策略不一定是严格的纳什均衡。(鹰鸽博弈) 鹰鸽博弈 解得p=1/4。当p1/4时,选择鹰策略的预期收入超过了鸽策略;当p1/4时,则相反。所以进化将导致种群1/4的参与人使用鹰策略。混合策略(1/4,3/4)是ESS。 证:S*=(1/4,3/4) S为任意其他策略(p,1-p),p≠1/4。 E(S*,S*)= =3/4=E(S,S*) 而 E(S*,S)= =5/4-2p E(S,S)= =1-4p2 比较上面两式: E(S*,S)E(S,S)恒成立 混合策略(1/4,3/4)是ESS 协调博弈 设某一同质种群的成员任意配对。在这博弈中,(L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。(S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使它为ESS必须使E(S*, S)E(S,S)成立(S*≠S) 在此博弈中参与人选择同一行动要好于选择不同行动,所以这个条件不满足,最可能背离在这个条件的S是纯策略L,这种情况下,E(S,S)=3, E(S*, S)=3/4 ,确实背离了条件E(S*, S)E(S,S). 局部渐进稳定性判断纳什均衡是否为ESS 动态方程——复制者动态 增长率 等于参与人的适合度 减去他的平均适合度 用此法进行协调博弈分析: 将A带入得 当初始状态p01/4时,参与人的进化稳定策略是D;当p01/4时,参与人进化稳定策略是L 注: 两种群进化稳定策略 定义:对于在△m×△n中(x*,y*)的一些邻域中的所有其他(x,y),要么x*·Ayx·Ay,要么y*·Bxy·Bx,那么称(x*,y*)为一个ESS. 定理:如果(x*,y*)是双矩阵博弈的一个ESS,那么x*和y*分别是△m和△n 中的纯策略 在单种群鹰鸽博弈中,混合策略是ESS,在两种群下则不是。 假设p是行参与人选择鹰策略(H)的概率,q是列参与人选择鹰策略的概率。行参与人的预期支付为: E(H)=q(-3)+2(1-q)=2-5q E(D)=q×0+(1-q)×1=1-q 对于列参与

文档评论(0)

秦圈圈 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档