第三讲非合作博弈的解（5）.pdfVIP

下载本文档

23
0
约8.94千字
约 20页
2018-11-23 发布于山东
举报

第三讲非合作博弈的解（5）.pdf

一、演化稳定策略。  在博弈论、行为生态学及演化心理学中，演化稳定策略ESS 是一个这样的策略，一旦它被给定环境中的参与人群体采用，它不能被任何其他可能的策略所侵略。一个ESS是纳什均衡的精炼。它是演化稳定的纳什均衡：一旦它在一个种群中得到确认，自然选择本身足以防止变异的可能策略侵略成功。  演化稳定策略由史密斯（John Maynard Smith ）和普莱斯（George R. Price ）在1973首先给出，并被用于人类学、演化心理学、哲学和政治科学之中。  进化稳定策略依赖于侵略的概念。一个X-策略参与人的群体被Y策略的参与人所造访。如果新的参与人使用Y策略比 X-策略的参与人得分更高，他被认为是侵略的。假定参与人能够选择和变换策略，这会导致原来的种群开始走向Y策略。  一个策略X是进化稳定的，如果没有策略Y能够侵略到它。也就是，采取新策略的物种来到X-策略的种群平均来说将不会获得比X策略的参与人更好的收益。  史密斯与普莱斯给出了进化稳定策略（ESS）的条件：一个策略S是ESS——进化稳定策略:对于所有的非S策略的T 策略（T≠S），或者E(S,S) E(T,S),或者E(S,S) = E(T,S) 且E(S,T) E(T,T)。  上面的定义可这样解释：对每个个体而言，在他人采取S 策略的情况下，S策略带给他的收益要严格高于T策略；或者在他人采取S的策略的情景下S策略带给他的收益与T策略是无差异的，但是严格高于他人采取T策略时的收益。此时，S是进化稳定的。  或者这样说：对于每个个体而言，在其他人采取S策略时采取S策略的收益不低于其他策略；而若其他人采取其他策略，采取S策略的收益一定高于采取其他策略。  ESS是子博弈精炼纳什均衡策略。在囚徒困境中 “不合作” 策略是ESS，因为 “不合作”是严格占优的。而在 “伤害邻居”的博弈中（表3.8），（不伤害,不伤害）与（伤害, 伤害）都是纳什均衡，但只有 “伤害”是一个ESS。“不伤害”则不是，因为在均采取 “不伤害”的均衡点处，一方的主动偏离尽管不会使自己收益增加，但会使对方收益减少。而因此 “伤害”能够中性地侵略到 “不伤害” 策略家的群体之中并占优势，因为 “伤害”对抗 “伤害” 得分高于 “不伤害”对抗 “伤害”的得分。表3.8 伤害邻居乙不伤害伤害甲不伤害 2,2 1,2 伤害 2,1 2,2  （二）重复博弈。  有一类动态博弈被称为重复博弈，参与人将某个静态博弈重复进行多次，参与人的收益为多次博弈的收益之和。这里，在计算收益之和时考虑了未来收益的贴现率。  重复博弈可分为有限次重复博弈与无限次重复博弈。若某个有限次重复博弈是完全且完美信息的动态博弈，与前面的动态博弈一样，我们可以用逆向归纳法对之进行求解。而对于无限次重复博弈，没有统一的求解博弈的方法。  在囚徒困境中均衡解对于参与人而言被认为是不合理的，它反映的是个体理性与集体理性的冲突。人们认为通过重复进行囚徒博弈就可以破解双方 “不合作”的困境。  对于有限次重复囚徒困境博弈，根据逆向归纳法，在最后一步每个人采取 “不合作”是最优策略；倒数第2步的最优策略为 “不合作”……第1步的最优策略。于是，若将囚徒困境博弈重复有限次，其解为，参与人每步都 “不合作”为纳什均衡。不合作合作 * * 不合作 2 ,2 4,1 合作 1，4 3,3  无限次重复囚徒困境呢？是否是在无限次重复囚徒困

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第三讲非合作博弈的解（5）.pdfVIP