第四讲 重复博弈(下).ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
表2 囚徒困境博弈 乙 招 不招 招 甲 不招 (这样一个博弈重复进行2次) 表3 囚徒困境博弈 乙 招 不招 招 甲 不招 (二) 存在多个NE的有限次重复博弈 例1:三价博弈 故事:两生产同质商品的寡头。在两寡头都是高价时市场总利润为10,都是中价时市场总利润为6,都是低价时市场总利润为2。两寡头同时决策,价格相同时分享利润,否则低价者独占。 三价博弈 存在两个纯策略纳什均衡(M,M)和(L,L)(还有混合策略)。但显然(H,H)帕雷托效率最高。是否重复(两次)进行能够实现使效率改善? 触发策略(trigger strategy) 一方的机会主义行为将触发其他参与人策略中的惩罚机制发生。我们把这种包含着奖励和惩罚机制的策略称为触发策略。正是由于害怕“触发”其他参与人的惩罚机制,所以不敢利用机会使自己在该阶段利益最大化,从而使该阶段的“合作”出现。从这个意义上看,触发策略是“温柔的”。 触发策略(trigger strategy) 假设寡头采取触发策略(trigger strategy),即开始选择合作,如果对方也合作,就一直合作;但在博弈中一旦发现对方不合作,就永远选择报复,不合作。 寡头1,第一次选H.如果第一次结果为(H,H), 则第二次选M;否则选L. 寡头2:同上。 子博弈精炼纳什均衡结果是:第一阶段(H,H),第二阶段(M,M)。 证明 第二阶段(M,M)是原博弈的纳什均衡,参与人的行为不会发生偏离。第一阶段(H,H)虽然不是原博弈的纳什均衡,单独偏离为M能增加1单位支付,但这样做第二阶段要损失2,因而不会偏离(H,H)。 三、无限次重复博弈 无限次重复博弈与有限次重复博弈的异同: 1、没有最后一阶段博弈; 2、不可忽略贴现问题 3、都可能通过惩罚来实现理想的均衡。 一、无限次重复的囚徒困境 以寡头削价竞争为例 基本博弈的结果是(L,L)。 前面已经证明,有限次重复不会改变结果。如果是无限次,则在贴现因子较大的情况下(比较重视长期利益)可能实现合作。 触发策略:第一阶段采取H,在t阶段,如果前t-1阶段的结果都是(H,H),则继续采用H;一旦发现对方不合作(L),则以后永远选择L报复。 假设参与人1已经采用了触发策略。 如果寡头2 也选择触发策略,则总支付的现值是: 如果寡头2不采取触发策略,在第一阶段采用L,因为第二阶段起被报复只能采用L,因而支付为(5,1,1,...)。总支付的现值是: 因此,只要 ,即 ,采用触发策略对寡头2就是明智的。 由于寡头1、2是对称的,因而同样可以证明触发策略对寡头1也是明智的。 这样,我们就证明了触发策略是一个纳什均衡。 由于博弈进行无限次,从任何一个阶段开始的子博弈都与这个博弈结构相同,因而触发促策略在任何一个子博弈上都是纳什均衡。 所以,触发策略构成该无限次重复博弈的子博弈精炼纳什均衡。 启发:在博弈重复无限次,且参与人都有耐心的情况下,任何短期的机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐意合作的声誉,同时也有积极性惩罚对方的机会主义行为。 无限次重复古诺模型 假定: ,边际成本都为2。 在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡: 在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如果前 t-1 阶段结果都是

文档评论(0)

2232文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档