第三讲 非合作博弈的解(5).pdfVIP

  • 23
  • 0
  • 约8.94千字
  • 约 20页
  • 2018-11-23 发布于山东
  • 举报
一、演化稳定策略。  在博弈论、行为生态学及演化心理学中,演化稳定策略ESS 是一个这样的策略,一旦它被给定环境中的参与人群体采 用,它不能被任何其他可能的策略所侵略。一个ESS是纳什 均衡的精炼。它是演化稳定的纳什均衡:一旦它在一个种 群中得到确认,自然选择本身足以防止变异的可能策略侵 略成功。  演化稳定策略由史密斯(John Maynard Smith )和普莱斯 (George R. Price )在1973首先给出,并被用于人类学、演 化心理学、哲学和政治科学之中。  进化稳定策略依赖于侵略的概念。一个X-策略参与人的群 体被Y策略的参与人所造访。如果新的参与人使用Y策略比 X-策略的参与人得分更高,他被认为是侵略的。假定参与 人能够选择和变换策略,这会导致原来的种群开始走向Y策 略。  一个策略X是进化稳定的,如果没有策略Y能够侵略到它。 也就是,采取新策略的物种来到X-策略的种群平均来说将 不会获得比X策略的参与人更好的收益。  史密斯与普莱斯给出了进化稳定策略(ESS)的条件:一 个策略S是ESS——进化稳定策略:对于所有的非S策略的T 策略(T≠S),或者E(S,S) E(T,S),或者E(S,S) = E(T,S) 且E(S,T) E(T,T)。  上面的定义可这样解释:对每个个体而言,在他人采取S 策略的情况下,S策略带给他的收益要严格高于T策略;或 者在他人采取S的策略的情景下S策略带给他的收益与T策 略是无差异的,但是严格高于他人采取T策略时的收益。 此时,S是进化稳定的。  或者这样说:对于每个个体而言,在其他人采取S策略时 采取S策略的收益不低于其他策略;而若其他人采取其他 策略,采取S策略的收益一定高于采取其他策略。  ESS是子博弈精炼纳什均衡策略。在囚徒困境中 “不合作” 策略是ESS,因为 “不合作”是严格占优的。而在 “伤害 邻居”的博弈中(表3.8),(不伤害,不伤害)与(伤害, 伤害)都是纳什均衡,但只有 “伤害”是一个ESS。“不 伤害”则不是,因为在均采取 “不伤害”的均衡点处, 一方的主动偏离尽管不会使自己收益增加,但会使对方 收益减少。而因此 “伤害”能够中性地侵略到 “不伤害” 策略家的群体之中并占优势,因为 “伤害”对抗 “伤害” 得分高于 “不伤害”对抗 “伤害”的得分。 表3.8 伤害邻居 乙 不伤害 伤害 甲 不伤害 2,2 1,2 伤害 2,1 2,2  (二)重复博弈。  有一类动态博弈被称为重复博弈,参与人将某个静态博 弈重复进行多次,参与人的收益为多次博弈的收益之和。 这里,在计算收益之和时考虑了未来收益的贴现率。  重复博弈可分为有限次重复博弈与无限次重复博弈。若 某个有限次重复博弈是完全且完美信息的动态博弈,与 前面的动态博弈一样,我们可以用逆向归纳法对之进行 求解。而对于无限次重复博弈,没有统一的求解博弈的 方法。  在囚徒困境中均衡解对于参与人而言被认为是不合理的, 它反映的是个体理性与集体理性的冲突。人们认为通过 重复进行囚徒博弈就可以破解双方 “不合作”的困境。  对于有限次重复囚徒困境博弈,根据逆向归纳法,在最 后一步每个人采取 “不合作”是最优策略;倒数第2步 的最优策略为 “不合作”……第1步的最优策略。于是, 若将囚徒困境博弈重复有限次,其解为,参与人每步都 “不合作”为纳什均衡。 不合作 合作 * * 不合作 2 ,2 4,1 合作 1,4 3,3  无限次重复囚徒困境呢?是否是在无限次重复囚徒困

文档评论(0)

1亿VIP精品文档

相关文档