网站大量收购闲置独家精品文档,联系QQ:2885784924

第四章重复博弈.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

*;第一节概述;2.重复博弈与序贯博弈的区别(123)

“序贯博弈”(se-quentialgame):参与人在前一个阶段的行动选择决定随后的子博弈的结构;从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,也即是,同样结构的子博弈只出现一次。

重复博弈则是同样结构的博弈重复多次。

重复博弈分为有限次重复博弈和无限次重复博弈。

;3.重复博弈的基本特征:

(1)阶段博弈之间没有“物质上”的联系(nophysicallinks),也就是说,前一阶段的博弈不改变后一阶段博弈的结构(对比之下,序贯博弈涉及物质上的联系);

(2)所有参与人都观测到博弈过去的历史(如在每一个新的阶段博弈,两个囚徒都知道同伙在过去的每次博弈中选择了抵赖还是坦白);

(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。;由于其他参与人过去行动的历史是观测得到的,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间,从而使重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次博弈中是从来不会出现的。这正是分析重复博弈的意义所在。

;4.影响重复博弈均衡结果的主要因素是:博弈重复的次数和信息的完备性(com-pleteness)。

重复次数的重要性:来自于参与人在短期利益和长远利益之间的权衡。当博弈只进行一次时,每个参与人只关心一次性的支付;但如果博弈重复多次,参与人可能会为了长远利益而牺牲眼前利益从而选择不同的均衡战略。;信息的完备性的重要性:当一个参与人的支付函数(特征)不为其他参与人所知时,该参与人可能有积极性建立一个“好”的声誉(reputation)以换取长远利益。

本节我们只讨论重复次数对均衡结果的影响,有关信息的完备性的影响将在不完全信息动态博弈部分讨论。

;二、几个基本概念;2.重复博弈博弈方的得益:

要考虑整个重复博弈过程得益的总体情况。当重复次数较多,每次重复间隔时间又较长时,需考虑得益的时间先后。一般是将每一阶段的得益折算成当前阶段的得益(即现在值)的贴现值。

贴现系数δ=1/(1+γ),γ为以一阶段为期限的市场利率。

;方法1:计算重复博弈的“总得益”,即博弈方各次重复博弈的得益的总和;

方法2:计算重复博弈各阶段的“平均得益”

;

第二节有限次重复博弈;二、有限次重复博弈类型

1.两人零和博弈的有限次重复博弈

博弈方的最佳策略都是每一次博弈都重复原博弈的混合策略NE策略。

2.存在唯一纯策略NE博弈的有限次重复博弈

例:有限次重复的囚徒困境博弈

有限次重复削价竞争博弈

连锁店悖论(泽尔腾1978年提出)(124);定理:

设G是阶段博弈,G(T)是G重复T次的重复博弈(T∞),那么,如果G有唯一的NE,则重复博弈G(T)的唯一子博弈精炼NE结果是阶段博弈G的NE重复T次,即每个阶段博弈出现的都是一次性博弈的均衡结果。

;3.存在多个纯策略NE博弈的有限次重复博弈

(1)存在两个纯战略纳什均衡的有限次重复博弈(课本)

三价博弈

设一市场有两个生产同质产品的厂商,他们对产品的定价有高、中、低三种可能。

;设高价时市场总利润为10单位

中价时市场总利润为6单位

低价时市场总利润为2单位。

再假设两厂商同时决定价格,价格不等时价格低者独享利润,价格相等时双方平分利润。

由此,两厂商对价格的选择就构成了一个静态博弈问题。

;原博弈有两个纯策略NE:

(M,M),(L,L)

一次博弈结果不会出现效率最高的(H,H)

在两次博弈中,则存在第一阶段采用(H,H)的SPNE。

双方策略:

对厂商1,第一次选择H;若第一次结果为(H,H),则第二次选择M;若第一次结果为其他,则第二次选择L。

厂商2的选择同厂商1。

;在上述双方策略组合下,两次重复博弈的路径为:第一阶段选择(H,H),第二阶段选择(M,M),这是一个SPNE路径。

若重复N次,结论也相似,SPNE路径是:每次都选择(H,H),最后一次选择原博弈的NE(M,M)。

;触发机制:首先试探合作,一旦发觉对方不合作,也用不合作相报复。

触发机制是重复博弈中实现合作和提高均衡效率的关键机制。;第三节无限次重复博弈;一、两人零和博弈的无限次重复博弈

在这种无限次重复博弈中,博弈方仍是每次都采用原博弈的混合策略NE。;二、存在唯一纯策略NE博弈的无限次重复博弈

如囚徒困境(课本)

触发机制:第一阶段采取抵赖,在第t阶段,如果前t-1阶段的结果都是(抵赖,抵赖),则继续采取抵赖;否则,采取坦白。

可以证明,当δ足够大时,双方采用上述触发机

文档评论(0)

clevercatty + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档