第四章重复博弈.ppt

下载文档

3
0
约2.88千字
约 31页
2021-12-07 发布于福建
举报
版权申诉
保障服务

第四章重复博弈.ppt

1、本文档共31页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第四章重复博弈本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行，但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发生变化，从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加，必须把整个重复博弈过程作为整体进行研究。本章主要内容 4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈 4.1 重复博弈引论 4.1.1 为何研究重复博弈 4.1.2 基本概念 4.1.1 为何研究重复博弈经济中的长期关系人们的预见性未来利益对当前行为的制约例如：长期合同、回头客、常客等。把这种关系理解成重复博弈，显然比理解成复杂的长期动态博弈更能反映问题的实质。 4.1.2 基本概念有限次重复博弈：给定一个基本博弈G（可以是静态博弈，也可以是动态博弈），重复进行T次G，并且在每次重复G之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈：一个基本博弈G一直重复博弈下去的博弈，记为G(∞)。还有一种“随机结束的重复博弈”。策略：博弈方的一个策略就是在每个阶段（即每次重复）针对每种情况如何行为的计划。子博弈：从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。均衡路径：由每个阶段博弈方的行为组合串联而成。重复博弈的得益考虑重复博弈总体得益的情况的方法之一是计算重复博弈的“总得益”，即各博弈方各次重复得益的总和。另一种方法是计算“平均得益”。 4.2 有限次重复博弈 4.2.1 两人零和博弈的有限次重复博弈 4.2.2 唯一纯策略纳什均衡博弈的有限次重复博弈 4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈 4.2.4 有限次重复博弈的民间定理 4.2.1 两人零和博弈的有限次重复博弈零和博弈是严格竞争的，重复博弈并不改变这一点。以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样，博弈方的正确策略是重复一次性博弈中的纳什均衡策略。 4.2.2 唯一纯策略纳什均衡博弈的有限次重复博弈定理：设原博弈G有唯一的纯策略纳什均衡,则对任意整数T，重复博弈 G(T)有唯一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍，平均得益的与原博弈G中的得益。 -5，-5 0，-8 -8，0 -1，-1 坦白不坦白囚徒2 坦白不坦白囚徒 1 （-5，-5） -10，-10 -13，-5 -5，-13 -6，-6 坦白不坦白囚徒2 坦白不坦白囚徒 1 （-10，-10）有限次重复削价竞争博弈 100，100 20，150 150，20 70，70 高价低价高价低价寡头2 寡头 1 削价竞争博弈有唯一纯策略纳什均衡（70，70）有限次重复的结果仍然是（低价，低价）连锁店悖论（塞尔顿1978年提出） B A · (1,10) · · (-2,3) (5,5) 打进不进打击不打击 4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈 5，5 3，3 2，0 0，2 2，0 6，0 0，2 0，6 1，1 H M H 厂商2 M L 厂商 1 L 三价博弈 2，2 3，1 3，1 1，3 4，4 7，1 1，3 1，7 8，8 厂商 1 厂商2 L M H H M L 两次重复三价博弈的等价模型触发策略：两博弈方先试探合作，一旦发现对方不合作，则也用不合作报复博弈方1：第一次选H；如第一次结果为(H,H)，则第二次选M，否则选L 博弈方2：同博弈方1 两市场博弈的重复博弈（重复两次） (A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.2,2.5)轮换策略一次纯策略+一次混合策略——(1.5,3)(3,1.5) 0，0 4，1 1，4 3，3 厂商 1 厂商2 B A A B 两市场博弈重复博弈不同策略、均衡及一次性博弈得益比较不同策略组合、均衡得益图示厂商2 得益厂商1得益 (1,4) (3,3) (2.5,2.5) (2,2) (3,1.5) (4,1) (1.5,3) 重复三次的触发策略：厂商1：第一阶段选A；如果第一阶段结果是（A，A），则第二阶段选A，如果第一阶段结果是（