第四章重复博弈解析.pptVIP

下载本文档

21
0
约1.29万字
约 69页
2016-11-03 发布于湖北
举报
版权申诉

第四章重复博弈解析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

经济博弈论张卫国教授第四章重复博弈本章主要内容： 1 重复博弈的概念； 2 作为一种特殊的动态博弈，有限次和无限次重复博弈的子博弈完美纳什均衡的求解方法； 3 无限次重复博弈古诺模型和效率工资模型。本章主要结论（民间定理）：由于参与者在重复博弈中具有了长期利益，可以通过在后面阶段中采取的报复策略使得威胁变得可信，从而摆脱静态博弈中“追求自身利益最大化”导致的囚徒困境，实现长期合作的结局。 4.1 几个概念重复博弈的概念有限次重复博弈的概念 4.1.1 重复博弈的概念 1 由简单的静态博弈（或动态博弈）的有限次（或无限次）重复进行构成的。 2 每一阶段博弈方、策略集合、规则和得益都相同。但是整个博弈过程中每个阶段的策略选择行为和最后的得益将受到影响。 3 包括：有限次重复博弈和无限次重复博弈 4 例子：多场决胜负的体育比赛（有限次）两寡头市场上两个厂商之间的竞争（无限次）商业中的回头客；长期合同；长期合作关系等。 4.1.2 有限次重复博弈的概念定义：给定一个博弈G，重复进行T次G，并且在每次重复之前各博弈方都能观察到以前博弈的结果，称为G的一个“T次重复博弈”，记为G(T)。其中，G成为G(T)的原博弈。每次重复称为G(T)的一个阶段。每个阶段都是一个博弈，因此与一般动态博弈有区别。 4.1.2 有限次重复博弈的概念几个概念： 1 子博弈：从某一阶段（不包括第一阶段）开始，包含以后所有阶段的原重复博弈的一部分。 2 策略：博弈方在每个阶段针对每种情况如何行动的计划（注：在每一阶段之前，博弈方是可以观察到以前博弈的结果的）。 4.1.2 有限次重复博弈的概念 3 路径：是每个阶段博弈结果（原博弈的一个策略组合）连接而成。对于具有n个策略组合的原博弈，重复T次的路径数为nT，重复博弈的求解即找出具有稳定性的均衡路径。 4 得益：不同于一般的动态博弈，重复博弈的得益为各个阶段得益的加总。考虑到时间的价值，需要引进“贴现系数”将未来的得益折算成当期得益的价值。 4.1.2 有限次重复博弈的概念贴现系数：δ＝ 1/(1+γ)，其中γ为以一阶段为期限的市场利率。给定贴现系数δ，若无限次重复博弈一路径的某博弈方各阶段的收益为，则该博弈方在该无限次重复博弈中的总收益为各阶段博弈中得益的“现在值”： 4.2 有限次重复博弈有限次重复的猜硬币博弈——原博弈为零和博弈有限次重复的囚徒困境博弈——原博弈有唯一的纯策略纳什均衡有多个纳什均衡的重复博弈的策略设计——触发策略有多个纳什均衡重复博弈的得益范围——民间定理 4.2.1 有限次重复的猜硬币博弈在零和博弈中，双方不存在合作的可能性，因此在长期进行的重复博弈中，子博弈完美纳什均衡由各个阶段原博弈的纳什均衡构成（例，在猜硬币博弈中以0.5的概率选择正面或者反面，即采取混合策略）。实际上，所有以零和博弈为原博弈所构成的重复博弈与猜硬币博弈构成的重复博弈一样，各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。 4.2.2 有限次重复的囚徒困境博弈图4－1 囚徒困境求解思路：对于有限次重复囚徒困境博弈，根据动态博弈的逆推归纳法可以求解。 4.2.2 有限次重复的囚徒困境博弈以两阶段（以该博弈作为原博弈G重复两次）为例：分析最后一阶段，子博弈即为原博弈，唯一的均衡为（－5，－5）；分析第一阶段，将最后阶段的收益（－5）添加到第一阶段的矩阵中，即：此时，博弈的纳什均衡仍是（坦白，坦白）。 4.2.2 有限次重复的囚徒困境博弈结论：在有限次重复博弈G(T)中，如果原博弈G存在唯一的纯策略纳什均衡组合，则重复博弈的唯一的子博弈完美纳什均衡解为各博弈方在每阶段都采取的原博弈纳什均衡策略。含义：在原博弈具有唯一均衡的有限次重复博弈中，由于完全理性的博弈方具有“共同知识”的分析推理能力，因此在从最后阶段开始的逆推过程中，仍然无法摆脱囚徒困境。 4.2.2 有限次重复的囚徒困境博弈如果原博弈存在唯一的纯策略纳什均衡组合，则有限次重复博弈的唯一的均衡解即各博弈方在每阶段（即每次重复）中都采用原博弈的纳什均衡策略。由于在这样的双方策略下，均衡路径中的每个阶段都不存在不可信的威胁或许诺，因此这种均衡是子博弈完美纳什均衡。 4.2.2 有限次重复的囚徒困境博弈定理设原博弈G有唯一的纯策略纳什均衡，则对任意正整数T，重复博弈G（T）有唯一的子博弈完美的解，即各博弈方每个阶段都采