- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 重复博弈 Chapter 4 Repeated Games 郑道文 @ 2010 Zheng Daowen, All Rights Reserved 第一节 重复博弈的概念 第二节 有限次重复博弈 第三节 无限次重复博弈 第一节 重复博弈的概念 一、序贯博弈(Sequential games) 序贯博弈是指参与人在前一阶段的行动选择决定随后的子博弈结构的动态博弈。 从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。 或者说,同样结构的子博弈只出现一次。 二、重复博弈(Repeated games) 1、定义 重复博弈是指同种结构的博弈多次重复进行构成的博弈过程。 属于动态博弈 阶段博弈(Stage game)。 2、特点: (1)各个阶段博弈相同---博弈的参与人、参与人的可选策略、规则和支付函数。 (2)阶段博弈之间没有“物质上”(或实质上)的联系。即前一阶段的博弈不改变后一阶段的博弈。 (3)所有参与人都能观察到博弈过程。 (4)参与人的总收支是所有阶段博弈收支的贴现值之和。 3、影响均衡结果的主要因素 (1)博弈重复的次数 存在长短期利益的权衡:博弈重复多次,参与人就会为了长远利益而牺牲眼前利益,从而选择不同的战略。由此可以解释合作行为和社会规范。 (2)信息的完备性 “声誉”(Reputation)的影响:当一个参与人的支付函数(特征)不为其它参与人所知晓时,该参与人可能有积极性建立一个“好”声誉(reputation)以换取长远利益。 第二节 有限次重复博弈 一、有限次重复博弈的概念 1、定义 给定一个博弈G,重复进行T次,并且在每次重复之前博弈的参与人都能观察到此前博弈的结果,这样的博弈过程称为G的一个“T次重复博弈”,记为G(T)。而G则称为G(T)的原博弈。G(T)中的每次重复称为G(T)的一个阶段。 2、特征 子博弈 战略:相机行动规则。在重复博弈的每个阶段上,参与人的一个战略就是该参与人在博弈的每一阶段上针对各种情况制定的一个相机行动计划。 路径:一般动态博弈与重复博弈的区别--重复博弈比较复杂。如果原博弈有n种策略组合,重复两次就有n2条博弈路径,重复T次就有nT条路径。 收支:是各阶段收支的和。有时也计算各阶段博弈的“平均收益”。 二、有限次重复博弈—猜硬币 两人零和、静态博弈; 重复的零和博弈不会创造出任何新的利益; 博弈双方根本不存在合作的可能性; 所有以零和博弈为原博弈构成的重复博弈中,参与人正确的战略就是在每次重复博弈中都采用一次性博弈的纳什均衡策略。 三、有限次重复博弈—囚徒的困境 假设: 有两个惯犯,每次判刑都不是很重。在刑满释放之后再作案,作案之后再判刑;刑满释放之后又作案,如此反复。 他们反复作案之后接受隔离审查过程就是一个重复博弈的过程。 四、定理(子博弈完美纳什均衡) 假设原博弈G有唯一的纯战略纳什均衡,则对任意正整数T(∞),(即有限次的)重复博弈G(T)有唯一的子博弈完美纳什均衡解,且它的子博弈完美纳什均衡就是所有参与人在每个阶段博弈中都选择原博弈G的纳什均衡策略。参与人在G(T)中的总收支为参与人在G中收支的T倍;平均每阶段的收支等于原博弈的收支。 五、原博弈有两个纳什均衡的重复博弈 原博弈有多个纯策略纳什均衡的情况下,重复博弈就可能有多个子博弈完美纳什均衡路径;重复次数越多,这种均衡路径也越多;并且,原博弈的非均衡策略组合在重复博弈中有可能构成子博弈完美纳什均衡的一部分。 1、假设: 两厂商1和2同时面临两个市场发展机会A和B。 每个厂商的能力都是有限的,只能选择一个市场来发展,即它们的可选策略为A或B。 收益矩阵如表所示: 2、一次性的静态博弈 两个纯策略的纳什均衡: (A, B)和(B, A); 一个混合战略纳什均衡: 厂商1和2都以相同的概率(0.5)在A和B之间随机选择,双方期望收益为0.25×(3+4+1+0)=2。 3、两次重复博弈 子博弈完美纳什均衡是无条件重复原博弈的某个纳什均衡或者是几个纳什均衡交替使用。 (1)轮流去两个市场 ①厂商1在第一阶段去A,第二阶段去B;厂商2第一阶段去B,第二阶段去A。均衡路径为第一次博弈(A, B),第二次(B, A)。每阶段平均收益为 (4+1)/2=2.5 ②厂商1在第一阶段去B,第二阶段去A;厂商2第一阶段去A,第二阶段去B。均衡路径为第一次博弈(B, A),第二次(A, B)。每阶段平均收益为 (4+1)/2=2.5 (2)连续两次出现原博弈的同一个纯策略纳什均衡 第一次为(A, B),第二次为(A, B);厂商1和2在各阶段的平均收益为(1,4)。 第一次为(B, A),第二次
原创力文档


文档评论(0)