博弈论基础的教学教案02.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论基础的教学教案02

这就证明了该策略组合是子博弈完美的。从这 条均衡路径中看到:将来利益对当前的选择有 约束。;?一方的机会主义行为将触发其他参与人策略中 的惩罚机制发生。;考虑如下抽象博弈:;上面的例子因为阶段博弈的NE很丰富,且存在 可供奖励和惩罚的NE,所以双方不仅可构造触 发策略,而且触发策略是子博弈完美的(或者 说触发策略所包含的奖励和惩罚是可信的)。; 参与人2 L M R P Q;除了(M,X)和(X,M)(X=L、R、P、Q) 的第二阶段是(P,P)或(Q,Q),其余的第二 阶段都是(R,R)。由分析可知,其中(M,M) 是NE,它表示路径(M,M);案例:;将价格提高到50每分。不久,Rubert Murdoch 公司也将价格重新提高至50美分。;Murdoch公司的做法和“触发策略”的益处在事后 看来更加明显。Murdoch公司的成功是因为它掌 握了博弈论的重要原则:你要了解竞争对手,也 让竞争对手了解你。因此,如果公司的策略为竞 争对手所明白,并且应向竞争对手清楚地表明公 司准备合作,但对背叛行为将采取以牙还牙的报 复行动,那么公司最终将赢得竞争,而竞争对手 通过合作也将大有收获。;二、无限次重复博弈;引入贴现因子δ, 若某个参与人在某一路 径的各个阶段的支付分别为: π1 、 π2 、……, 则该参与人在该路径的“总支付” π为 无限序列 π1 、 π2 、……的现值之和,即: π = π1+ δ π2 + δ2 π3 + ……;无限次重复博弈及其支付的定义:;现在分析无限次重复囚徒困境博弈。我们将证明 尽管阶段博弈中唯一的NE是不合作的(招认, 招认),在有限次重复时,唯一的子博弈完美NE 还是在每个阶段都(招认,招认),可是在无限次 重复(在可预见的将来不会结束)进行的情况下, 只要参与人有足够的内心(即δ足够接近1),每个 阶段的行动组合为(沉默,沉默) 将形成一条子博 弈完美NE的路径。;?注意:参与人制订了一个关于未来的无所不包 的行动计划,即一次性地选择了函数形式si(·)作 为 应对策略,而不是一期只作出依次行动选择。;序列5,1,1,……的贴现值之和:;(二)民间定理(无名氏定理);无限??付序列π、 π 、……的现值之和V为:;那么, π就是无限支付序列π1 、 π2 、……的平均支付,它是各阶段支付现值之和的 (1- δ )倍。 ;0;Folk Theorem(Friedman 1971) Let G be a finite ,static game of complete information.Let (e1,e2, ……,en)denote the payoffs from a Nash equilibrium of G, and let (x1,x2 、…、xn) denote any other feasible payoffs from G. If xi >ei for every player i and if δ is sufficiently close to 1, then there exists a subgame-perfect Nash equilibrium of the infinitely repeated game G(∞, δ) that achieves (x1,x2 、…、xn) as the average payoff. (P127);例如“囚徒困境”无限次重复博弈中…P128;0;?问题:δ并非足够接近1会怎样?;三、无限次重复博弈中的“合作”策略;1、 δ足够接近1( δ ≥9/17),触发策略均衡下 平均支付达到(a-c)2/8。 P131-132

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档