博弈论重复博弈.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《博弈论与信息经济学》 第四章 重复博弈 本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。 本章分三节 4.1 重复博弈基本概念 4.2 有限次重复博弈 4.3 无限次重复博弈 4.1 基本概念 有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。 无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G( ) 策略:博弈方在每个阶段针对每种情况如何行为的计划 子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分 均衡路径:由每个阶段博弈方的行为组合串联而成 重复博弈的得益 的平均得益 为 相同的现在值,则称 得益序列 阶段的得益,能产生与 无限次重复博弈)各个 重复博弈或 作为重复博弈(有限次 :如果一常数 , , L L , , 2 1 2 1 p p p p p p 平均得益 4.2 有限次重复博弈 4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理 4.2.1 两人零和博弈的有限次重复博弈 零和博弈是严格竞争的,重复博弈并不改变这一点。 以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。 4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈 定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。 -5,-5 0,-8 -8,0 -1,-1 坦 白 不坦白 囚徒2 坦白 不坦白 囚 徒 1 (-5,-5) -10,-10 -13,-5 -5,-13 -6,-6 坦 白 不坦白 囚徒2 坦白 不坦白 囚 徒 1 (-10,-10) 有限次重复削价竞争博弈 100,100 20,150 150,20 70,70 高 价 低 价 高价 低价 寡头2 寡 头 1 削价竞争博弈 有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价) 连锁店悖论(Chainstore Paradox) 1.进入威慑 (40,50) (-10,-10) (0,300) 进入 容忍 斗争 不进入 2.理论与实际的差别 恐怖活动 1.人质博弈 (-10,-20) (5,-10) (0,0) 绑架人质 攻击 谈判 不绑架 T G 2.杀戮博弈 (3,-20) (5,-25) (0,0) 绑架人质 攻击 谈判 不绑架 T G 4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈 5,5 3,3 2,0 0,2 2,0 6,0 0,2 0,6 1,1 H M H 厂商2 M L 厂 商 1 L 三价博弈 2,2 3,1 3,1 1,3 4,4 7,1 1,3 1,7 8,8 厂 商 1 厂商2 L M H H M L 两次重复三价博弈的等价模型 触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1 两市场博弈的重复博弈(重复两次) (A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5) 0,0 4,1 1,4 3,3 厂 商 1 厂商2 B A A B 两市场博弈 重复博弈不同策略、均衡及一次性博弈得益比较 不同策略组合、均衡得益图示 厂商2 得益 厂商1得益 (1,4) (3,3) (2.5,2.5) (2,2) (3,1.5) (4,1) (1.5,3) 轮换策略仍然不是最理想的情况,最佳结果(A,A)无法实现是因为两次博弈中博弈方没有运用触发策略

文档评论(0)

企业资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档