博弈论完整课件浙江大学GAMEChapter3章节幻灯片.pptVIP

下载本文档

6
0
约9.8千字
约 45页
2018-03-29 发布于未知
举报
版权申诉

博弈论完整课件浙江大学GAMEChapter3章节幻灯片.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

现在分析无限次重复囚徒困境博弈。我们将证明尽管阶段博弈中唯一的NE是不合作的(招认，招认)，在有限次重复时，唯一的子博弈完美NE 还是在每个阶段都(招认，招认)，可是在无限次重复（在可预见的将来不会结束）进行的情况下，只要参与人有足够的内心(即δ足够接近1)，每个阶段的行动组合为(沉默，沉默) 将形成一条子博弈完美NE的路径。考虑参与人的触发策略：在第一阶段选择不坦白，且在之后的任意阶段t，如果之前的（t-1）阶段的结果是双方都不坦白，则继续选择不坦白，否则从t阶段开始永远选择坦白。 ?注意：参与人制订了一个关于未来的无所不包的行动计划，即一次性地选择了函数形式si(·)作为应对策略，而不是一期只作出依次行动选择。序列5，1，1，……的贴现值之和： 5 + δ·1 + δ2·1 + δ3·1 + … … = 5 + δ / (1 – δ) 沉默的现值 4 / (1 - δ) 招认的现值 5 + δ / (1 – δ) ≥ δ ≥ 1/4 这说明，当且仅当δ ≥ 1/4，给定对方的触发策略并且对方没有首先选择招认，自己也不会首先招认。（二）民间定理(无名氏定理) P125 “民间定理”第一段。先明确两个关于支付的概念。平均支付average payoff：在无限次重复博弈中，平均支付指为了得到相等的支付现值之和而在每一阶段都应得到的等额支付值。计算：令贴现因子为δ，那么无限支付序列π1 、 π2 、 ……的现值之和V为： V=∑ δt-1 πt ∞ t =1 无限支付序列π、 π 、……的现值之和V为： V= π + πδ + πδ2 + …… = π / (1- δ ) 如果下式成立： ∑ δt-1 πt ∞ t =1 = π / (1- δ ) 即： π = (1- δ ) ∑ δt-1 πt ∞ t =1 那么， π就是无限支付序列π1 、 π2 、……的平均支付，它是各阶段支付现值之和的 (1- δ )倍。可行支付向量feasible payoffs:支付数组x=(x1， x2 、…、xn)称为可行支付向量，如果它是阶段博弈G的纯策略支付的凸组合(concave combination)(即xi是阶段博弈中参与人i的纯策略支付的加权平均值，权数非负且和为1)。可行支付向量。以“囚徒困境”为例… 一个可行支付向量对应重复博弈的一条路径。 0 囚徒1的支付值囚徒 2 的支付值 1 2 3 4 5 1 2 3 4 5 · · · · (1,1) (4,4) (5,0) (0,5) 阴影面积中的任意一个坐标点都是一个可行支付向量。哪些对应着均衡路径？ Folk Theorem(Friedman 1971) Let G be a finite ,static game of complete information.Let (e1,e2, ……,en)denote the payoffs from a Nash equilibrium of G, and let (x1，x2 、…、xn) denote any other feasible payoffs from G. If xi ＞ei for every player i and if δ is sufficiently close to 1, then there exists a subgame-perfect Nash equilibrium of the infinitely repeated game G(∞, δ) that achieves (x1，x2 、…、xn) as the average payoff. (P127) 例如“囚徒困境”无限次重复博弈中…P128 Nash 威胁点Nash threat point (e1,e2, ……,en) 保留支付reservation payoff:参与人i的保留支付是指无论其它参与人如何行动，参与人i能够保证得到的最大支付；它意味着即使其它参与人试图给参与人i最大惩罚时，参与人i至少能保证得到的支付。通常以υi表示参与人i的保留支付。阶段博弈囚徒困境中υi= ei =1；阶段博弈古诺模型中υi= 0，而ei=(a-c)2/9， υi≠ei。个体理性支付 individually rational payoffs 即大于保留支付的支付。这个概念的涵义是，如果要一个参与人在无限次重复博弈中有任何兴趣“合作”的话，他从“合作”中得到的支付不应该小于他的保留支付。 Fudenberg Maskin 于1986年证明，民间定理中的(e1,e2, ……,en)可以用(υ