- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
重 复 博 弈 重复博弈 动态博弈的类型 序贯博弈sequential game 每一个阶段的博弈结构是不同的,即从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。或者说,同样结构的博弈只出现一次。 重复博弈repeated game 是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如“囚徒困境”中小偷每次作案后判刑释放后又作案。 分为有限次重复博弈与无限次重复博弈 重 复 博 弈 有限次重复博弈 定义 给定一个博弈G,重复进行T次G,并且在每次重复之前各参与人都能观察到以前博弈的结果,这样的博弈过程称为G的一个“T次重复博弈”,记为G(T)。而G则称为G(T)的原博弈。 G(T)中的每次重复称为G(T)的一个阶段。 几点说明 子博弈 动态博弈中的子博弈及SPNE在重复博弈中适用 策略 路径 重复博弈使博弈结果有了更多的可能,如果原博弈有n条路径,重复两次博弈则有n2条路径,重复T次就有nT条路径 支付 特别说明:重复博弈中的支付 在有限次博弈中,每一次的博弈都有一组结果即支付组合,因此重复博弈中各参与人的支付应该是他们每阶段支付相加的“总支付”(无限次重复支付的计算要更复杂一些) 用每阶段的平均支付来进行比较各阶段重复博弈和各种均衡效率 如果博弈次数少,重复时间较近,无需引用贴现系数 如果博弈次数较多,重复时间较长,可以引进贴现系数?,未来支付折算成当前支付 有 限 重 复 博 弈 有限重复博弈简单地说就是阶段博弈实施有限次(T次)。如我们考虑T=2。考虑下列博弈: 有 限 重 复 博 弈 它有一个Nash 均衡(U,L),假设博弈进行两次, 两阶段重复博弈中每个参与人的得益相当于 各个阶段得益之和(或者平均数),考虑到贴现 因子δ,再一次借助于逆向归纳法, 第二阶段 唯一的Nash均衡为(U,L),得益向量为(1,1),所 得的贴现值为(δ,δ), 有 限 重 复 博 弈 有限次重复猜硬币博弈 猜硬币博弈是一个零和博弈,重复零和博弈不会创造出任何新的利益(因为每个阶段博弈总是一方赢一方输,总支付还是为零和)。 因此双方合作的可能性根本不存在,即使双方都知道还要进行重复许多次这样的博弈也不会改变他们在当前的阶段博弈中的行为方式,即他们不可能变得合作和顾及对方的利益。 有限次重复猜硬币博弈 所以,以猜硬币博弈作为原博弈的重复博弈中,每个博弈方唯一正确的选择是在每次重复时都采用一次性博弈中所采用的NE,即以0.5的概率随机选择正面和反面的混合策略,双方每次重复的期望值和期望总支付为零。 注意的是,所有以零和博弈为原博弈的重复博弈,与上述问题都有相同的结论,即都采用一次性博弈中的纳什均衡策略。 有限次重复囚徒困境的博弈 如果Policeman给这两个囚徒两次机会,即重复两次原博弈,其结果(即他俩关押的年限)会是怎样? 两博弈先进行第一次博弈后,双方都看到最后结果,然后再进行第二次博弈。 用逆推归纳法求解 先求第二阶段博弈的解——仍是原博弈的解(坦白,坦白)支付组合为(-5,-5) 再回到第一阶段。由于双方都知道后一阶段的结果即(-5,-5),因此此时双方都知道整个两次重复博弈的结果,双方的最终支付肯定就是在本阶段的双方支付基础上各加上-5,博弈结果仍是(坦白,坦白)支付组合(-10,-10) 有限次重复囚徒困境的博弈 第一阶段 有限次重复囚徒困境的博弈 从结果上看,两次重复囚徒的困境相当于独立地进行两次一次性的囚徒的困境博弈,然后把两个独立博弈的支付相加。 这个结果具有一般意义。 在有限次重复博弈中,如果原博弈存在唯一的纯策略NE,则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许诺,因此重复博弈的解也是SPNE。 定理 设原博弈G有唯一的纯策略NE,则对任意正整数T,重复博弈G(T)有唯一的SPNE,即各博弈方每个阶段采用原博弈G的纳什均衡策略。各博弈方在G(T)中的总支付为在原博弈G中支付的T倍,平均每阶段支付等于原博弈G中的支付。 注意1 可以用逆推归纳法证明该定理。 注意2 该定理说明了,所有具有唯一NE的静态博弈构成的重复博弈,它们和零和博弈一样,都是原博弈的一次性博弈的简单重复和支付相加。 有限次重复削价竞争博弈 重复囚徒困境悖论 有限次重复博弈并不能摆脱囚徒的困境的低效率均衡。 这与人们的直觉经验并不完全一致,因为根据这种结论寡头之间的价格战应该是随时都在发生的,但现实中的寡头的价格战却没有这么普遍。 此外,在重复囚徒的困境博弈的大量实验研究中,重复次数较大时的实验结果通常也与上述理论结论,包含合作的情况比较普遍。 连锁店悖论(Selten 1978) 设有如下市场进入博弈 连锁店悖论(Selten) 假定同样
文档评论(0)