- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[管理学]博弈论第十一课
第四章 重复博弈 重复博弈这种博弈关系在现实中有普遍性。重复次数的重要性来自于参与人在短期利益和长期利益之间的权衡。当博弈只进行一次,参与人只关心一次性的支付;但如果博弈重复多次,参与认可能会为了长远利益而牺牲眼前利益从而选择不同的均衡策略。这是重复博弈分析给出的一个强有力的结果,它为现实中观测到的许多合作行为和社会规范提供了解释。 张维迎 基本概念 有限次重复博弈G(T) 无限次重复博弈G(∞) 随机结束的重复博弈 二、策略、子博弈和均衡路径 重复博弈是一种特殊的动态博弈。因此动态博弈中的子博弈及相关概念和结论,包括子博弈完美纳什均衡概念,以逆推归纳法为核心的子博弈完美纳什均衡分析及相关结论,都可以推广到重复博弈中。 分析重复博弈就是要在重复博弈的mT条博弈路径中找出具有稳定性的均衡路径,并分析它们的效率意义。 三、重复博弈的得益 重复博弈中博弈方的行为、策略选择不可能只考虑本阶段的得益,而必须兼顾其他阶段的得益,或考虑整个重复博弈过程得益的总体情况。 重复博弈的“总得益”计算: 各阶段的“平均得益”计算(对无限次重复博弈): 随机停止重复博弈问题可以转化为无限次重复博弈进行分析。 4.2 有限次重复博弈 结论:在整个零和博弈的有限次重复博弈中,所有博弈方的惟一选择就是始终采用原博弈的混合策略纳什均衡策略。 4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈 连锁店悖论 4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈 一条更为高效的子博弈完美纳什均衡路径 二、两市场博弈的重复博弈 两市场的两阶段重复博弈 两市场的三阶段重复博弈 在三次重复博弈中可以采用如下触发策略: 4.2.4 有限次重复博弈的民间定理 定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。 4.3 无限次重复博弈 结论:在零和博弈的无限次重复博弈中,所有博弈方的惟一选择就是始终采用原博弈的混合策略纳什均衡策略。 4.3.2 惟一纯策略纳什均衡博弈的无限次重复博弈 采用冷酷策略的博弈分析 假设两厂商都采用如下触发策略:第一阶段采用H,在第t阶段,如果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。 二、无限次重复博弈的民间定理 定理:设G是一个完全信息的静态博弈。用(e1,…,en)记G的纳什均衡的得益,用(x1,…,xn)表示G的任意可实现得益。如果xiei对任意博弈方i都成立,而δ足够接近1,那么无限次重复博弈G(∞,δ)中一定存在一个子博弈完美的纳什均衡,各博弈方的平均得益就是(x1,…,xn)。 4.3.3 无限次重复古诺模型 古诺模型的一次性静态博弈 二、低水平的合作 在第一阶段生产q*(该产量在qm/2和qc之间),在第t阶段,如果前t-1阶段的结果都是( q*, q*),则继续生产q*,否则生产古诺产量qc=2 三、加大惩罚力度和提高合作水平 第一阶段生产垄断产量的一半qm/2;在第t阶段,如果第t-1阶段的结果为(qm/2, qm/2),则生产qm/2,如果第t-1阶段的结果为(x,x),也生产qm/2,否则生产x。 关于触发策略(Trigger strategies) 两个最著名的触发策略: 严格的礼尚往来触发策略: 两人“囚徒困境”重复博弈锦标赛 礼尚往来策略存在的问题 案例: 古诺寡头模型 设一市场有1、2两家厂商生产同样的产品。如果厂商1的产量为 ,厂商2的产量为 ,则市场总产量为 。设市场出清价格 (可以将产品全部卖出去的价格)是市场总产量的函数 。再设两厂商的生产都无固定成本,且每增加一个单位产量的边际成本相等, , 即它们分别生产 和 单位产量的总成本分别为 和 。两厂商同时决定各自的产量。 古诺寡头模型 双方的得益 古诺模型的纳什均衡 是最大值问题 的解。 上述两式各自对 、 的求导,令其导数为0。 解之得该方程组的唯一一组解: 双方各自得益为: 从两厂商总体利益最大化角度作产量选择 设总产量为 ,则总得益为: 可得: 把规定被背叛以后连续惩罚K次的礼尚往来策略,称为惩罚K次的礼尚往来策略。惩罚1次的礼尚往来策略,特别叫做严格的礼尚往来策略。 严格的礼尚往来策略,是最不严厉的礼尚往来策略。实际上,一些学者称之为不记仇的礼尚往来策略。 密歇根大学的政治学家罗伯特·艾克
文档评论(0)