博弈论第三章题稿.ppt

下载文档 降价啦

3
0
约3.38千字
约 44页
2017-04-21 发布于湖北
举报
版权申诉
保障服务

博弈论第三章题稿.ppt

1、本文档共44页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Chapter 3 Repeated Games;张维迎P207—209;　1、阶段博弈之间没有“物质上”的联系（no Physical links），也就是说，前一阶段博弈不改变后一阶段博弈的结构（对比之下，序惯博弈涉及到物质上的联系）；　２、所有参与人都观测到博弈过去的历史；　３、参与人的总支付是所有阶段支付的贴现值之和或加权平均值。;　?２：分析重复博弈的意义　因为其他参与人过去行动的历史是观测得到的，一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史，因此，参与人在重复博弈中的策略空间远远大于和复杂于每一个阶段博弈的策略空间（试想囚徒困境博弈重复５次，每个囚徒的纯策略数量会有多少？策略组合的数量会更多）。这意味着，重复博弈可能带来一些“额外的”均衡结果，这些结果在一次性博弈中是不会出现的。;重复次数的重要性来自于参与人在短期利益和长期利益之间的权衡。当博弈只进行一次，参与人只关心一次性的支付；但如果博弈重复多次，参与认可能会为了长远利益而牺牲眼前利益从而选择不同的均衡策略。这是重复博弈分析给出的一个强有力的结果，它为现实中观测到的许多合作行为和社会规范提供了解释。;一、有限次重复博弈（以two-stage repeated games为例）; 回忆第二章第四节的“有同时选择的两阶段动态博弈”。;而在两阶段囚徒困境中,第二阶段的NE可以完全不依赖于第一阶段的结果。;下面给出有限次重复博弈的定义;有限次“囚徒困境”博弈的NE再一次表明了为什么会爆发价格战。试想两博弈方不是囚徒而是两个大公司，比如可口可乐公司和百事可乐公司、或者是联合利华公司和宝洁公司，如果摆在这些公司面前的是两种拓展市场份额策略的选择：保持原价或降低价格，“囚徒困境”博弈告诉我们这些公司会降低价格并不断重复下去。这个结论是令人沮丧的。但实际情况并非完全如此。那么在什么情况下，它们会合作呢？;200次“囚徒困境”的博弈中与对方争斗。计算机中的竞赛结果表明，合作是可以出现的，即使竞争双方是理性的、自私的。这个胜出的策略就是“触发??略”（“针锋相对”策略），这一策略着眼于合作，从合作出发而不是相互背叛。几轮博弈之后，各方的策略就会明朗起来，互为对方所知晓和理解。;Proposition If the stage game G has a unique Nash equilibrium then, for any finite T,the repeated game G(T) has a unique subgame- perfect outcome:the Nash equilibrium of G is played in every stage. ?注 ;?注：在阶段博弈G为完全且完美信息动态博弈时类似的结论同样成立。设G属于第三章所定义的完全且完美信息动态博弈，如果G有唯一的逆推归纳解，则G(T)有唯一的子博弈完美NE：其中每一阶段的结果都是G的逆推归纳解。类似的，设G为第三章所定义的有同时选择的两阶段动态博弈，如果G有唯一的子博弈NE，则G(T)也有唯一的子博弈完美NE：G的子博弈完美NE重复进行T次。;（二）阶段博弈存在两个以上NE;这4条均衡路径及其支付是：;?路径的支付采用平均支付与采用总支付相比的优点：平均支付可以与阶段博弈的支付相比较。;*该博弈如果重复三次构成一个三阶段的重复博弈，由每阶段都重复或交替阶段博弈的纯策略NE，那么子博弈完美NE路径有几条？;甲：第一阶段开发A市场；第二阶段视第一阶段的结果而定—如果结果是（A，A），则选 A，如果是（A，B），则选B；第三阶段无条件选B。乙：第一阶段开发A；第二阶段开发B；第三阶段根据第一阶段的结果而定—如果第一阶段结果是（A，A），则选A，否则选B。;对应的路径：;这就证明了该策略组合是子博弈完美的。从这条均衡路径中看到：将来利益对当前的选择有约束。;?一方的机会主义行为将触发其他参与人策略中的惩罚机制发生。;考虑如下抽象博弈：;上面的例子因为阶段博弈的NE很丰富，且存在可供奖励和惩罚的NE，所以双方不仅可构造触发策略，而且触发策略是子博弈完美的（或者说触发策略所包含的奖励和惩罚是可信的）。; 参与人2 L M R P Q;除了（M，X）和（X，M）（X=L、R、P、Q）的第二阶段是（P，P）或（Q，