- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6.3讲:RepeatedGames(III):以“囚徒困境博弈”为例报告
存在唯一纯策略纳什均衡博弈的有限次重复博弈 定理: 设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T ,重复博弈G(T) 有唯一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G 的纳什均衡策略。 * * 存在唯一纯策略纳什均衡博弈的有限次重复博弈(续) 利用逆推归纳法证明 首先,分析重复博弈G(T)的最后一个阶段,即第T次重复 由于第T次重复就是原博弈G,并且在该阶段之后不再重复,因此不管以前T-1阶段的博弈结果如何,在该阶段中各博弈方必然采用G的唯一的纳什均衡。 * 存在唯一纯策略纳什均衡博弈的有限次重复博弈(续) 然后,再推回到前一阶段,即第T-1次重复 由于此时各博弈方都知道下一阶段(即第T阶段)的博弈结果,因此对每个博弈方来说,从该阶段开始的子博弈(即最后两个阶段)中各种策略组合的得益就是本阶段的得益加上下一阶段的均衡得益的贴现值。因此,各博弈方在该阶段仍将采用G的唯一的纳什均衡。 * 存在唯一纯策略纳什均衡博弈的有限次重复博弈(续) 依此类推直至博弈的第一阶段。 最终,可得结论! * 存在唯一纯策略纳什均衡博弈的有限次重复博弈(续) 有唯一纯策略纳什均衡的有限次重复博弈不比一次性博弈的结果理想,因为唯一的子博弈完美纳什均衡是各博弈方每次重复都采用原博弈的纳什均衡。 * 存在唯一纯策略纳什均衡博弈的无限次重复博弈 存在唯一纯策略纳什均衡博弈的无限次重复博弈 以囚徒困境式博弈的无限次重复为例 * 囚徒困境式博弈的无限次重复博弈 囚徒困境式博弈的无限次重复 下面的分析将表明,在囚徒困境式博弈的无限次重复博弈中,对双方有利的合作(指双方克制自己的行为,为对方的利益和共同的利益着想,并非真正的联合、合作)在子博弈完美纳什均衡中有可能存在,博弈可能出现比较理想的结果。 以削价竞争博弈的无限次重复为例。 * 削价竞争博弈 * 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 H和L分别表示高价(不削价)和低价(削价)策略 削价竞争博弈(续) 该博弈的一次性博弈有唯一的纯策略纳什均衡(L,L),得益组合为(1,1)。 * 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 削价竞争博弈(续) 策略组合(H,H)实现的得益组合(4,4)比(1,1)高得多。但因为(H,H)并不是该博弈的纳什均衡,因此在一次性博弈中不会被采用,这是一个典型的囚徒困境式博弈。 * 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 削价竞争博弈(续) 该博弈的有限次重复博弈不能实现潜在的合作利益,两博弈方在每次重复中都不会采用效率较高的(H,H)。 * 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 触发策略(Trigger Strategy) 重复博弈中博弈方首先试探合作,一旦发现对方不合作则用不合作报复的策略,称为“触发策略”。 触发策略是重复博弈中实现合作和提高均衡效率的关键机制,是重复博弈分析中构造子博弈完美纳什均衡的基本“构件”之一。 * “冷酷策略”(grim strategy)又称为“触发策略”(trigger strategy),因为任何参与人的一次性不合作将触发永远的不合作。(张维迎,2012,第126页) 在冷酷战略下,参与人没有改正错误的机会。所以这个战略确实是很冷酷的,但冷酷的结果是双方都没有背叛对方的积极性,因而是友善的。(张维迎,2012,第127页) * * 削价竞争博弈的无限次重复 削价竞争博弈的无限次重复 假设两博弈方都采用触发策略:第一阶段采用H,在第 t 阶段,如果前 t-1 阶段的结果都是(H,H),则继续采用H,否则采用L。 双方在无限次重复博弈中都是先试图合作,第一次无条件选H,如果对方采用的也是合作态度,则坚持选H;一旦发现对方不合作(选择L),则用以后永远选择L报复。 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 削价竞争博弈的无限次重复(续) 证明:当贴现系数δ较大时,双方采用上述触发策略构成无限次重复博弈的一个子博弈完美纳什均衡。 * 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 触发策略:第一阶段采用H,在第 t 阶段,如果前 t-1 阶段的结果都是(H,H),则继续采用H,否则采用L。 削价竞争博弈的无限次重复(续) 证明: 首先,证明双方采用上述触发策略是一个纳什均衡。 然后,证明上述触发策略组合构成整个无限次重复博弈的子博弈完美纳什均衡。 * 博弈方2 H L 博弈方1 H 4,4 0,5 L 5,0 1,1 触发策略:第一阶段采用H,在第 t 阶段,如果前 t-1 阶段的结果都是(H,H),则继续采用H,否则采用L。 削价竞争博弈的无限次重复(续) 证明双方采用
文档评论(0)