网站大量收购独家精品文档,联系QQ:2885784924

博弈论第三章题稿.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter 3 Repeated Games;张维迎P207—209; 1、阶段博弈之间没有“物质上”的联系(no Physical links),也就是说,前一阶段博弈 不改变后一阶段博弈的结构(对比之下,序惯 博弈涉及到物质上的联系);  2、所有参与人都观测到博弈过去的历史;  3、参与人的总支付是所有阶段支付的贴现 值之和或加权平均值。; ?2:分析重复博弈的意义 因为其他参与人 过去行动的历史是观测得到的,一个参与人可以 使自己在某个阶段博弈的选择依赖于其他参与人 过去的行动历史,因此,参与人在重复博弈中的 策略空间远远大于和复杂于每一个阶段博弈的策 略空间(试想囚徒困境博弈重复5次,每个 囚徒的纯策略数量会有多少?策略组合的数量会 更多)。这意味着,重复博弈可能带来一些“额 外的”均衡结果,这些结果在一次性博弈中是不 会出现的。;重复次数的重要性来自于参与人在短期利益和 长期利益之间的权衡。当博弈只进行一次,参 与人只关心一次性的支付;但如果博弈重复多 次,参与认可能会为了长远利益而牺牲眼前利 益从而选择不同的均衡策略。这是重复博弈分 析给出的一个强有力的结果,它为现实中观测 到的许多合作行为和社会规范提供了解释。;一、有限次重复博弈 (以two-stage repeated games为例); 回忆第二章第四节的“有同时选择的两阶段动态博弈”。;而在两阶段囚徒困境中,第二阶段的NE可以完全 不依赖于第一阶段的结果。;下面给出有限次重复博弈的定义;有限次“囚徒困境”博弈的NE再一次表明了为什么 会爆发价格战。试想两博弈方不是囚徒而是两个 大公司,比如可口可乐公司和百事可乐公司、或 者是联合利华公司和宝洁公司,如果摆在这些公 司面前的是两种拓展市场份额策略的选择:保持 原价或降低价格,“囚徒困境”博弈告诉我们这些 公司会降低价格并不断重复下去。这个结论是令 人沮丧的。但实际情况并非完全如此。那么在什 么情况下,它们会合作呢?;200次“囚徒困境”的博弈中与对方争斗。计算机 中的竞赛结果表明,合作是可以出现的,即使 竞争双方是理性的、自私的。这个胜出的策略 就是“触发??略”(“针锋相对”策略),这一策 略着眼于合作,从合作出发而不是相互背叛。 几轮博弈之后,各方的策略就会明朗起来,互 为对方所知晓和理解。;Proposition If the stage game G has a unique Nash equilibrium then, for any finite T,the repeated game G(T) has a unique subgame- perfect outcome:the Nash equilibrium of G is played in every stage. ?注 ;?注:在阶段博弈G为完全且完美信息动态博弈 时类似的结论同样成立。设G属于第三章所定义 的完全且完美信息动态博弈,如果G有唯一的逆 推归纳解,则G(T)有唯一的子博弈完美NE:其 中每一阶段的结果都是G的逆推归纳解。类似的, 设G为第三章所定义的有同时选择的两阶段动态 博弈,如果G有唯一的子博弈NE,则G(T)也有唯 一的子博弈完美NE:G的子博弈完美NE重复进 行T次。;(二)阶段博弈存在两个以上NE;这4条均衡路径及其支付是:;?路径的支付采用平均支付与采用总支付相比的 优点:平均支付可以与阶段博弈的支付相比较。;*该博弈如果重复三次构成一个三阶段的重复 博弈,由每阶段都重复或交替阶段博弈的纯策 略NE,那么子博弈完美NE路径有几条?;甲:第一阶段开发A市场;第二阶段视第一阶段 的结果而定—如果结果是(A,A),则选 A,如果是(A,B),则选B;第三阶段无 条件选B。 乙:第一阶段开发A;第二阶段开发B;第三阶 段根据第一阶段的结果而定—如果第一阶段 结果是(A,A),则选A,否则选B。;对应的路径:;这就证明了该策略组合是子博弈完美的。从这 条均衡路径中看到:将来利益对当前的选择有 约束。;?一方的机会主义行为将触发其他参与人策略中 的惩罚机制发生。;考虑如下抽象博弈:;上面的例子因为阶段博弈的NE很丰富,且存在 可供奖励和惩罚的NE,所以双方不仅可构造触 发策略,而且触发策略是子博弈完美的(或者 说触发策略所包含的奖励和惩罚是可信的)。; 参与人2 L M R P Q;除了(M,X)和(X,M)(X=L、R、P、Q) 的第二阶段是(P,P)或(Q,

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档