第三章 完全信动态博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定理 如果阶段博弈G有唯一的Nash均衡,那么对任意有限次重复博弈G(T)有唯一的子博弈精炼Nash均衡结果:G的Nash均衡重复T次。 例 连锁店悖论(Selten) 考虑市场进入阻挠博弈 假定同样的市场有20个(可以理解为在位者有20个联锁店), 进入者每次进人一个市场,博弈就成了20次的重复博弈。人们也许会猜想,尽管从一个市场看,在位者的最优选择是默许,但因为有20个市场要保护,为了防止进入者进入其他19个市场,应该选择斗争,但子博弈精练的结果进入者在每一市场选择进入,而在位者总是选择默许。 默许 斗争 进入 不进入 5,5 -2,3 1,10 1,10 A B B 进入 不进入 默许 斗争 (5, 5) (-2, 3) (1,10) 四、 无限次重复博弈的求解 将囚犯困境一般化: B 合作 不合作 A 合作 R=-1, R=-1 S=-10, T=0 不合作 T=0,S=-10 P=-8,P=-8 其中,TRPS, R(T+S)/2(交替的背叛和被背叛不如合作好) 问题:如何走出“囚犯困境”? 方法:引入重复博弈。常见策略有“冷酷战略”和“针锋相对” 冷酷战略 ( 也叫“触发策略” ) (1) 开始选择抵赖(合作); (2)选择抵赖(合作)一直到有一方选择坦白(不合作), 然后永远选择坦白(不合作) B 合作 不合作 A 合作 R=-1, R=-1 S=-10, T=0 不合作 T=0,S=-10 P=-8,P=-8 下面证明,只要每个人有足够的耐心,该策略是精炼Nash均衡 设贴现因子为δ。对于某个局中人i : 总是合作的期望收益: i首先不合作的期望收益: 令π1 > π2可得: (1) δ足够大,如果对方不坦白, i 就没有积极性坦白 例如,囚犯困境中, 所以,当 时,如果对方不坦白, i 就没有积极性坦白 合作 不合作 合作 R=-1, R=-1 S=-10, T=0 不合作 T=0,S=-10 P=-8,P=-8 (2) 如果对方坦白, i 必须坦白 结论:如果博弈重复无穷次,且每个人有足够的耐心,任何短期的机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义行为。 δ反映了人们对未来收益的看法,δ越大,说明未来收益越重要。 δ也表示了博弈双方再次相遇的可能性,这种可能性越大,δ越大。 δ 也可代表耐心程度, δ=0没有耐心。 冷酷策略的评价: 缺点:参与人没有改正的机会,很冷酷; 优点:冷酷的结果是双方都没有背叛对方的积极性,因而是友善的。 2. 无限次重复博弈的民间定理 相关概念: 可行支付向量:阶段博弈G的纯策略支付的凸组合。 可行支付集合V:所有可行支付向量的集合。 例如:两寡头削价竞争博弈 4,4 0,5 5,0 1,1 H L H L 该博弈一次性博弈均衡是都采用低价,是囚犯困境型博弈 Nash均衡 厂商2 支付 厂商1支付 (1,4) (3,3) (1,1) (4,1) (5,0) (5,0) 子博弈精炼均衡结果 可行支付向量集合 练习:画出囚犯困境问题的可行支付向量集和子博弈精练均衡结果集。 坦白 抵赖 坦白 抵赖 -8,-8 0,-10 -10,0 -1,-1 例:合谋的持久性:价格战的发生机制 考虑价格战。 首先介绍伯川德(Bertrand)寡头模型 价格竞争寡头的博弈模型 前提假设:产品有一定差别,即产品之间有很强的替代性,但又不是完全替代,即价格不同时,价格较高的不会完全销不出去。 设两个厂商的需求函数分别为: d1,d2为产品的替代系数 则它们的利润函数分别为: 从而可得它们的反应函数分别为: 解出 设贴现因子为δ。pi(t)表示企业i 在t期的价格, 表示企业价格,则其利润现值为: 令 :企业i 的合谋利润; :企业i 的Bertrand竞争利润; :企业j遵守合谋定价,企业i 违背时的利润; 则有: 坦白 抵赖 坦白 抵赖 -8,-8 0,-10 -10,0 -1,-1 (参考“囚犯困境”,相当于0-1-8) 下面分析企业i 何时背离,何时合谋? 考虑企业i在 时期背离,企业j 随之进行Bertrand竞争以惩罚i ,于是企业i的最佳反应也是进行Bertrand竞争。则其利润现值为: 企业i一直合谋的利润现值为: 时,企业i 不值得背离。 当 结论:当 时冷酷战略促使合谋得以维持。 “同时”是一个信息概念,而不是一个时间概念。 一、 动态博弈与静态博弈的区别 静态博弈:所有局中人同时行动;或行动虽有先后,但没有人在自己行动之前观测到别人的行动。

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档