网站大量收购独家精品文档,联系QQ:2885784924

第六章:重复博弈与合作行为.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章:重复博弈与合作行为

第六章 序惯博弈(sequential game) 序惯博弈:参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次; 重复博弈(repeated game) 重复博弈:同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game). 以囚徒困境为例,如果每次判刑不是很重(至少不是无期徒刑),那么,两个囚徒在刑满释放之后再作案,作案之后再判刑,释放之后再作案,如此等等,他们之间进行的就是重复博弈,其中每次作案是一个阶段博弈。 重复博弈的三个特征 阶段博弈之间没有“物质上”的联系(no physical links),也就是说,前一阶段的博弈不改变后一阶段的结构; 所有参与人都观察到博弈过去的历史; 参与人的总支付是所有阶段博弈支付的贴现值之和。 影响重复博弈均衡结果的因素 博弈重复的次数 重复次数的重要性来自于参与人在短期利益和长远利益之间的权衡。这是重复博弈分析给出的一个强有力的结果,为现实中观测到许多合作行为和社会规范提供解释。 信息的完备性(completeness) 当一个参与人的支付函数(特征)不为其他参与人所知时,该参与人可能有积极性建立一个“好”声誉以换取长远利益。这一点可以解释为什么那些本质上并不好的人在相当长的时期内干好事。 基本概念 有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。 无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G(∞) 基本概念 策略:博弈方在每个阶段针对每种情况如何行为的计划。 子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分。 均衡路径:由每个阶段博弈方的行为组合串联而成。 重复博弈的得益 “囚徒困境”的一般表示 支付函数 双方都不合作: 对 的解释: 贴现率; 博弈继续的概率; 一般化:未来收益的重要程度 两人零和博弈的有限次重复博弈 零和博弈是严格竞争的,重复博弈并不改变这一点。 以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。 唯一纯策略纳什均衡博弈的有限次重复博弈 定理:设原博弈G有唯一的纯策略纳什均衡,则对任意正整数T,重复博弈 G(T)有唯一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的等于原博弈G中的得益。 有限次重复博弈:连锁店悖论(chain_store paradox) 多个纯策略纳什均衡博弈的有限次重复博弈 触发策略的进一步讨论 触发策略可信性较强的博弈 博弈方1:在第一阶段采用H,如果第一阶段结果是(H,H),那么第二阶段采用M,否则采用P; 博弈方2:在第一阶段采用H;如果第一阶段结果是(H,H),那么第二阶段采用M,否则采用Q。 两市场博弈的重复博弈(重复两次) (A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5) 两市场博弈及重复博弈各均衡的平均得益 不同策略组合、均衡得益图示 触发策略 厂商1:第一阶段选A;如果第一阶段结果是(A,A),则第二阶段选A,如果第一阶段结果是(A,B),则第二阶段选B;第三阶段无条件选B。 厂商2:第一阶段选A,第二阶段无条件选B,如果第一阶段结果是(A,A),则第三阶段选A;如果第一阶段结果是(B,A),则第三阶段选B。 均衡路径:(A,A)—(A,B)—(B,A) 有限次重复博弈的民间定理(Folk Theorem) 个体理性得益(Individual Rationality Payoff) :不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益 可实现得益(Feasible Payoff) :博弈中所有纯策略组合得益的加权平均数组 定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。 两人零和博弈的无限次重复博弈 两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡. 唯一

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档