7重复博弈:对称信息讲述.ppt

7重复博弈:对称信息讲述

重复博弈和信誉问题 如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。 囚徒困境博弈 重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例: All-D: 不论过去什么发生,总是选择不合作; All-C: 不论过去什么发生,总是选择合作; 合作-不合作交替进行; tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动; trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。 支付函数 双方都不合作: 对 的解释: 贴现率; 博弈继续的概率; 二者的结合; 一般化:未来收益的重要程度 Tit-for-tat 纳什均衡,但不是精炼纳什均衡: Why Not A Perfect NE 假定A在t=5的时候,没有合作。根据TFT战略,在t=6,B应该选择惩罚(不合作)。B会这样吗? 如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为: 反之,如果B原谅A, Trigge

文档评论(0)

1亿VIP精品文档

相关文档