- 23
- 0
- 约8.94千字
- 约 20页
- 2018-11-23 发布于山东
- 举报
一、演化稳定策略。
在博弈论、行为生态学及演化心理学中,演化稳定策略ESS
是一个这样的策略,一旦它被给定环境中的参与人群体采
用,它不能被任何其他可能的策略所侵略。一个ESS是纳什
均衡的精炼。它是演化稳定的纳什均衡:一旦它在一个种
群中得到确认,自然选择本身足以防止变异的可能策略侵
略成功。
演化稳定策略由史密斯(John Maynard Smith )和普莱斯
(George R. Price )在1973首先给出,并被用于人类学、演
化心理学、哲学和政治科学之中。
进化稳定策略依赖于侵略的概念。一个X-策略参与人的群
体被Y策略的参与人所造访。如果新的参与人使用Y策略比
X-策略的参与人得分更高,他被认为是侵略的。假定参与
人能够选择和变换策略,这会导致原来的种群开始走向Y策
略。
一个策略X是进化稳定的,如果没有策略Y能够侵略到它。
也就是,采取新策略的物种来到X-策略的种群平均来说将
不会获得比X策略的参与人更好的收益。
史密斯与普莱斯给出了进化稳定策略(ESS)的条件:一
个策略S是ESS——进化稳定策略:对于所有的非S策略的T
策略(T≠S),或者E(S,S) E(T,S),或者E(S,S) = E(T,S)
且E(S,T) E(T,T)。
上面的定义可这样解释:对每个个体而言,在他人采取S
策略的情况下,S策略带给他的收益要严格高于T策略;或
者在他人采取S的策略的情景下S策略带给他的收益与T策
略是无差异的,但是严格高于他人采取T策略时的收益。
此时,S是进化稳定的。
或者这样说:对于每个个体而言,在其他人采取S策略时
采取S策略的收益不低于其他策略;而若其他人采取其他
策略,采取S策略的收益一定高于采取其他策略。
ESS是子博弈精炼纳什均衡策略。在囚徒困境中 “不合作”
策略是ESS,因为 “不合作”是严格占优的。而在 “伤害
邻居”的博弈中(表3.8),(不伤害,不伤害)与(伤害,
伤害)都是纳什均衡,但只有 “伤害”是一个ESS。“不
伤害”则不是,因为在均采取 “不伤害”的均衡点处,
一方的主动偏离尽管不会使自己收益增加,但会使对方
收益减少。而因此 “伤害”能够中性地侵略到 “不伤害”
策略家的群体之中并占优势,因为 “伤害”对抗 “伤害”
得分高于 “不伤害”对抗 “伤害”的得分。
表3.8 伤害邻居
乙 不伤害 伤害
甲
不伤害 2,2 1,2
伤害 2,1 2,2
(二)重复博弈。
有一类动态博弈被称为重复博弈,参与人将某个静态博
弈重复进行多次,参与人的收益为多次博弈的收益之和。
这里,在计算收益之和时考虑了未来收益的贴现率。
重复博弈可分为有限次重复博弈与无限次重复博弈。若
某个有限次重复博弈是完全且完美信息的动态博弈,与
前面的动态博弈一样,我们可以用逆向归纳法对之进行
求解。而对于无限次重复博弈,没有统一的求解博弈的
方法。
在囚徒困境中均衡解对于参与人而言被认为是不合理的,
它反映的是个体理性与集体理性的冲突。人们认为通过
重复进行囚徒博弈就可以破解双方 “不合作”的困境。
对于有限次重复囚徒困境博弈,根据逆向归纳法,在最
后一步每个人采取 “不合作”是最优策略;倒数第2步
的最优策略为 “不合作”……第1步的最优策略。于是,
若将囚徒困境博弈重复有限次,其解为,参与人每步都
“不合作”为纳什均衡。
不合作 合作
* *
不合作 2 ,2 4,1
合作 1,4 3,3
无限次重复囚徒困境呢?是否是在无限次重复囚徒困
原创力文档

文档评论(0)