博弈论完整课件浙江大学GAMEChapter3章节幻灯片.pptVIP

博弈论完整课件浙江大学GAMEChapter3章节幻灯片.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现在分析无限次重复囚徒困境博弈。我们将证明 尽管阶段博弈中唯一的NE是不合作的(招认, 招认),在有限次重复时,唯一的子博弈完美NE 还是在每个阶段都(招认,招认),可是在无限次 重复(在可预见的将来不会结束)进行的情况下, 只要参与人有足够的内心(即δ足够接近1),每个 阶段的行动组合为(沉默,沉默) 将形成一条子博 弈完美NE的路径。 考虑参与人的触发策略:在第一阶段选择不坦 白,且在之后的任意阶段t,如果之前的(t-1) 阶段的结果是双方都不坦白,则继续选择不坦 白,否则从t阶段开始永远选择坦白。 ?注意:参与人制订了一个关于未来的无所不包 的行动计划,即一次性地选择了函数形式si(·)作 为 应对策略,而不是一期只作出依次行动选择。 序列5,1,1,……的贴现值之和: 5 + δ·1 + δ2·1 + δ3·1 + … … = 5 + δ / (1 – δ) 沉默的现值 4 / (1 - δ) 招认的现值 5 + δ / (1 – δ) ≥ δ ≥ 1/4 这说明,当且仅当δ ≥ 1/4,给定对方的触发策 略并且对方没有首先选择招认,自己也不会首 先招认。 (二)民间定理(无名氏定理) P125 “民间定理”第一段。 先明确两个关于支付的概念。 平均支付average payoff:在无限次重复博弈中, 平均支付指为了得到相等的支付现值之和而在每 一阶段都应得到的等额支付值。计算: 令贴现因子为δ,那么无限支付序列π1 、 π2 、 ……的现值之和V为: V=∑ δt-1 πt ∞ t =1 无限支付序列π、 π 、……的现值之和V为: V= π + πδ + πδ2 + …… = π / (1- δ ) 如果下式成立: ∑ δt-1 πt ∞ t =1 = π / (1- δ ) 即: π = (1- δ ) ∑ δt-1 πt ∞ t =1 那么, π就是无限支付序列π1 、 π2 、……的平均支付,它是各阶段支付现值之和的 (1- δ )倍。 可行支付向量feasible payoffs:支付数组x=(x1, x2 、…、xn)称为可行支付向量,如果它是阶段 博弈G的纯策略支付的凸组合(concave combination)(即xi是阶段博弈中参与人i的纯策 略支付的加权平均值,权数非负且和为1)。 可行支付向量。以“囚徒困境”为例… 一个可行支付向量对应重复博弈的一条路径。 0 囚徒1的支付值 囚 徒 2 的 支 付 值 1 2 3 4 5 1 2 3 4 5 · · · · (1,1) (4,4) (5,0) (0,5) 阴影面积中的任意一个坐标 点都是一个可行支付向量。 哪些对应着均衡路径? Folk Theorem(Friedman 1971) Let G be a finite ,static game of complete information.Let (e1,e2, ……,en)denote the payoffs from a Nash equilibrium of G, and let (x1,x2 、…、xn) denote any other feasible payoffs from G. If xi >ei for every player i and if δ is sufficiently close to 1, then there exists a subgame-perfect Nash equilibrium of the infinitely repeated game G(∞, δ) that achieves (x1,x2 、…、xn) as the average payoff. (P127) 例如“囚徒困境”无限次重复博弈中…P128 Nash 威胁点Nash threat point (e1,e2, ……,en) 保留支付reservation payoff:参与人i的保留支付 是指无论其它参与人如何行动,参与人i能够保 证得到的最大支付;它意味着即使其它参与人 试图给参与人i最大惩罚时,参与人i至少能保证 得到的支付。通常以υi表示参与人i的保留支付。 阶段博弈囚徒困境中υi= ei =1;阶段博弈古诺模 型中υi= 0,而ei=(a-c)2/9, υi≠ei。 个体理性支付 individually rational payoffs 即大 于保留支付的支付。 这个概念的涵义是,如果要 一个参与人在无限次重复博弈中有任何兴趣“合 作”的话,他从“合作”中得到的支付不应该小于 他的保留支付。 Fudenberg Maskin 于1986年证明,民间定 理中的(e1,e2, ……,en)可以用(υ

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档