- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter 3 Repeated Games;张维迎P207—209; 1、阶段博弈之间没有“物质上”的联系(no
Physical links),也就是说,前一阶段博弈
不改变后一阶段博弈的结构(对比之下,序惯
博弈涉及到物质上的联系);
2、所有参与人都观测到博弈过去的历史;
3、参与人的总支付是所有阶段支付的贴现
值之和或加权平均值。; ?2:分析重复博弈的意义 因为其他参与人
过去行动的历史是观测得到的,一个参与人可以
使自己在某个阶段博弈的选择依赖于其他参与人
过去的行动历史,因此,参与人在重复博弈中的
策略空间远远大于和复杂于每一个阶段博弈的策
略空间(试想囚徒困境博弈重复5次,每个
囚徒的纯策略数量会有多少?策略组合的数量会
更多)。这意味着,重复博弈可能带来一些“额
外的”均衡结果,这些结果在一次性博弈中是不
会出现的。;重复次数的重要性来自于参与人在短期利益和
长期利益之间的权衡。当博弈只进行一次,参
与人只关心一次性的支付;但如果博弈重复多
次,参与认可能会为了长远利益而牺牲眼前利
益从而选择不同的均衡策略。这是重复博弈分
析给出的一个强有力的结果,它为现实中观测
到的许多合作行为和社会规范提供了解释。;一、有限次重复博弈
(以two-stage repeated games为例); 回忆第二章第四节的“有同时选择的两阶段动态博弈”。;而在两阶段囚徒困境中,第二阶段的NE可以完全
不依赖于第一阶段的结果。;下面给出有限次重复博弈的定义;有限次“囚徒困境”博弈的NE再一次表明了为什么
会爆发价格战。试想两博弈方不是囚徒而是两个
大公司,比如可口可乐公司和百事可乐公司、或
者是联合利华公司和宝洁公司,如果摆在这些公
司面前的是两种拓展市场份额策略的选择:保持
原价或降低价格,“囚徒困境”博弈告诉我们这些
公司会降低价格并不断重复下去。这个结论是令
人沮丧的。但实际情况并非完全如此。那么在什
么情况下,它们会合作呢?;200次“囚徒困境”的博弈中与对方争斗。计算机
中的竞赛结果表明,合作是可以出现的,即使
竞争双方是理性的、自私的。这个胜出的策略
就是“触发??略”(“针锋相对”策略),这一策
略着眼于合作,从合作出发而不是相互背叛。
几轮博弈之后,各方的策略就会明朗起来,互
为对方所知晓和理解。;Proposition If the stage game G has a unique
Nash equilibrium then, for any finite T,the
repeated game G(T) has a unique subgame-
perfect outcome:the Nash equilibrium of G is
played in every stage. ?注 ;?注:在阶段博弈G为完全且完美信息动态博弈
时类似的结论同样成立。设G属于第三章所定义
的完全且完美信息动态博弈,如果G有唯一的逆
推归纳解,则G(T)有唯一的子博弈完美NE:其
中每一阶段的结果都是G的逆推归纳解。类似的,
设G为第三章所定义的有同时选择的两阶段动态
博弈,如果G有唯一的子博弈NE,则G(T)也有唯
一的子博弈完美NE:G的子博弈完美NE重复进
行T次。;(二)阶段博弈存在两个以上NE;这4条均衡路径及其支付是:;?路径的支付采用平均支付与采用总支付相比的
优点:平均支付可以与阶段博弈的支付相比较。;*该博弈如果重复三次构成一个三阶段的重复
博弈,由每阶段都重复或交替阶段博弈的纯策
略NE,那么子博弈完美NE路径有几条?;甲:第一阶段开发A市场;第二阶段视第一阶段
的结果而定—如果结果是(A,A),则选
A,如果是(A,B),则选B;第三阶段无
条件选B。
乙:第一阶段开发A;第二阶段开发B;第三阶
段根据第一阶段的结果而定—如果第一阶段
结果是(A,A),则选A,否则选B。;对应的路径:;这就证明了该策略组合是子博弈完美的。从这
条均衡路径中看到:将来利益对当前的选择有
约束。;?一方的机会主义行为将触发其他参与人策略中
的惩罚机制发生。;考虑如下抽象博弈:;上面的例子因为阶段博弈的NE很丰富,且存在
可供奖励和惩罚的NE,所以双方不仅可构造触
发策略,而且触发策略是子博弈完美的(或者
说触发策略所包含的奖励和惩罚是可信的)。; 参与人2
L M R P Q;除了(M,X)和(X,M)(X=L、R、P、Q)
的第二阶段是(P,P)或(Q,
您可能关注的文档
- 产品质量数据包信息管理系统说明文档讲义.ppt
- 初一地理第一章地球与地图复习B题稿.ppt
- JD-ⅠA型计算机联锁系统题稿.pptx
- 博思堂的五大策略宝典55创作策略c题稿.ppt
- 博思堂的五大策略宝典55创作策略题稿.ppt
- 产品众筹方案讲义.ppt
- 第01章电子商务题稿.ppt
- JDE-财务-简版题稿.pptx
- 初一地理七年级下册日本题稿.ppt
- 产品专题2—复式、跃层、错层、LOFT讲义.ppt
- 2025年安徽工商职业学院单招职业技能测试题库带答案(典型题).docx
- 2025年洛阳科技职业学院单招职业技能测试题库带答案(新).docx
- 2025年荆门职业学院单招职业技能测试题库及答案(易错题).docx
- 2025年宣化科技职业学院单招职业技能测试题库(精练).docx
- 2025年包头职业技术学院单招职业技能测试题库带答案(新).docx
- 2025年江西工商职业技术学院单招职业技能测试题库带答案(精练).docx
- 2025年黑龙江农业经济职业学院单招职业技能测试题库精编.docx
- 2025年山东艺术设计职业学院单招职业技能测试题库带答案(基础题).docx
- 2025年陕西工商职业学院单招职业技能测试题库带答案(突破训练).docx
- 2025年承德护理职业学院单招职业技能测试题库【word】.docx
文档评论(0)