第8章-重复博弈教程文件.ppt

上述战略为参与者提供了两种手段: 其一是(单阶段的)惩罚,这时企业生产x; 其二是(潜在无限阶段的)合作,这时企业的产量为 。如果任何一 个企业偏离了合作,则惩罚开始,如果任何一个企业背离了惩罚,则会使博弈进入又一轮惩罚。如果两个企业都不肯离惩罚,则在下一阶段又回到合作。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 如果两企业都采用上面的“两面”战略,则无限重复博弈里的子博弈就可归为两类: (1)合作的子博弈,其前面一个阶段的结果是 或 (x, x); (2)惩罚的子博弈,其前面一个阶段的结果既非 ,又不是(x, x)。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 两企业都采取上面的“两面”战略要成为一个子博弈精炼Nash均衡,则在其每一类子博弈中遵循该战略必须是Nash均衡。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 具体地说,在合作的子博弈中,每一企业与本期得到 的收益,且下期得到惩罚的现值收益 V(x)相比,必须更愿意永远得到垄断收益的一半,即 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在惩罚的子博弈中,每一企业与本期得到 的收益,且下期又开始惩罚相比,企业更愿意共同执行惩罚产量,即 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 罗伯特·爱克斯罗德实验 罗伯特·爱克斯罗德(政治科学家),对合作的问题具有研究兴趣。为了进行关于合作的研究,他组织了一场计算机竞赛。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 这个竞赛的思路非常简单: 任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间

文档评论(0)

1亿VIP精品文档

相关文档