博弈论基础的教学教案02.pptVIP

下载本文档

1
0
约1.64千字
约 25页
2017-06-29 发布于江西
举报
版权申诉

博弈论基础的教学教案02.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论基础的教学教案02

这就证明了该策略组合是子博弈完美的。从这条均衡路径中看到：将来利益对当前的选择有约束。;?一方的机会主义行为将触发其他参与人策略中的惩罚机制发生。;考虑如下抽象博弈：;上面的例子因为阶段博弈的NE很丰富，且存在可供奖励和惩罚的NE，所以双方不仅可构造触发策略，而且触发策略是子博弈完美的（或者说触发策略所包含的奖励和惩罚是可信的）。; 参与人2 L M R P Q;除了（M，X）和（X，M）（X=L、R、P、Q）的第二阶段是（P，P）或（Q，Q），其余的第二阶段都是（R，R）。由分析可知，其中（M，M）是NE，它表示路径（M，M）;案例：;将价格提高到50每分。不久，Rubert Murdoch 公司也将价格重新提高至50美分。;Murdoch公司的做法和“触发策略”的益处在事后看来更加明显。Murdoch公司的成功是因为它掌握了博弈论的重要原则：你要了解竞争对手，也让竞争对手了解你。因此，如果公司的策略为竞争对手所明白，并且应向竞争对手清楚地表明公司准备合作，但对背叛行为将采取以牙还牙的报复行动，那么公司最终将赢得竞争，而竞争对手通过合作也将大有收获。;二、无限次重复博弈;引入贴现因子δ, 若某个参与人在某一路径的各个阶段的支付分别为： π1 、 π2 、……，则该参与人在该路径的“总支付” π为无限序列 π1 、 π2 、……的现值之和，即： π = π1+ δ π2 + δ2 π3 + ……;无限次重复博弈及其支付的定义：;现在分析无限次重复囚徒困境博弈。我们将证明尽管阶段博弈中唯一的NE是不合作的(招认，招认)，在有限次重复时，唯一的子博弈完美NE 还是在每个阶段都(招认，招认)，可是在无限次重复（在可预见的将来不会结束）进行的情况下，只要参与人有足够的内心(即δ足够接近1)，每个阶段的行动组合为(沉默，沉默) 将形成一条子博弈完美NE的路径。;?注意：参与人制订了一个关于未来的无所不包的行动计划，即一次性地选择了函数形式si(·)作为应对策略，而不是一期只作出依次行动选择。;序列5，1，1，……的贴现值之和：;（二）民间定理(无名氏定理);无限??付序列π、 π 、……的现值之和V为：;那么， π就是无限支付序列π1 、 π2 、……的平均支付，它是各阶段支付现值之和的 (1- δ )倍。 ;0;Folk Theorem(Friedman 1971) Let G be a finite ,static game of complete information.Let (e1,e2, ……,en)denote the payoffs from a Nash equilibrium of G, and let (x1，x2 、…、xn) denote any other feasible payoffs from G. If xi ＞ei for every player i and if δ is sufficiently close to 1, then there exists a subgame-perfect Nash equilibrium of the infinitely repeated game G(∞, δ) that achieves (x1，x2 、…、xn) as the average payoff. (P127);例如“囚徒困境”无限次重复博弈中…P128;0;?问题：δ并非足够接近1会怎样？;三、无限次重复博弈中的“合作”策略;1、 δ足够接近1（ δ ≥9/17），触发策略均衡下平均支付达到(a-c)2/8。 P131-132