第三章完全信动态博弈.pptVIP

下载本文档

4
0
约9.65千字
约 43页
2019-03-17 发布于浙江
举报
版权申诉

第三章完全信动态博弈.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

定理如果阶段博弈G有唯一的Nash均衡，那么对任意有限次重复博弈G(T)有唯一的子博弈精炼Nash均衡结果：G的Nash均衡重复T次。例连锁店悖论(Selten) 考虑市场进入阻挠博弈假定同样的市场有20个(可以理解为在位者有20个联锁店), 进入者每次进人一个市场,博弈就成了20次的重复博弈。人们也许会猜想，尽管从一个市场看，在位者的最优选择是默许，但因为有20个市场要保护，为了防止进入者进入其他19个市场，应该选择斗争，但子博弈精练的结果进入者在每一市场选择进入，而在位者总是选择默许。默许斗争进入不进入 5，5 -2，3 1，10 1，10 A B B 进入不进入默许斗争 (5, 5) (-2, 3) (1,10) 四、无限次重复博弈的求解将囚犯困境一般化： B 合作不合作 A 合作 R=-1， R=-1 S=-10， T=0 不合作 T=0，S=-10 P=-8，P=-8 其中，TRPS， R(T+S)/2（交替的背叛和被背叛不如合作好）问题：如何走出“囚犯困境”？方法：引入重复博弈。常见策略有“冷酷战略”和“针锋相对” 冷酷战略（也叫“触发策略” ） (1) 开始选择抵赖（合作）； (2)选择抵赖（合作）一直到有一方选择坦白（不合作）, 然后永远选择坦白（不合作） B 合作不合作 A 合作 R=-1, R=-1 S=-10, T=0 不合作 T=0,S=-10 P=-8,P=-8 下面证明，只要每个人有足够的耐心，该策略是精炼Nash均衡设贴现因子为δ。对于某个局中人i : 总是合作的期望收益： i首先不合作的期望收益：令π1 ＞ π2可得：（1） δ足够大，如果对方不坦白， i 就没有积极性坦白例如，囚犯困境中，所以，当时，如果对方不坦白， i 就没有积极性坦白合作不合作合作 R=-1, R=-1 S=-10, T=0 不合作 T=0,S=-10 P=-8,P=-8 （2）如果对方坦白， i 必须坦白结论：如果博弈重复无穷次，且每个人有足够的耐心，任何短期的机会主义行为的所得都是微不足道的，参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的机会主义行为。 δ反映了人们对未来收益的看法,δ越大,说明未来收益越重要。 δ也表示了博弈双方再次相遇的可能性,这种可能性越大,δ越大。 δ 也可代表耐心程度， δ=0没有耐心。冷酷策略的评价：缺点：参与人没有改正的机会，很冷酷；优点：冷酷的结果是双方都没有背叛对方的积极性，因而是友善的。 2. 无限次重复博弈的民间定理相关概念：可行支付向量：阶段博弈G的纯策略支付的凸组合。可行支付集合V：所有可行支付向量的集合。例如：两寡头削价竞争博弈 4，4 0，5 5，0 1，1 H L H L 该博弈一次性博弈均衡是都采用低价，是囚犯困境型博弈 Nash均衡厂商2 支付厂商1支付 (1,4) (3,3) (1,1) (4,1) (5,0) (5,0) 子博弈精炼均衡结果可行支付向量集合练习：画出囚犯困境问题的可行支付向量集和子博弈精练均衡结果集。坦白抵赖坦白抵赖 -8，-8 0，-10 -10，0 -1，-1 例：合谋的持久性：价格战的发生机制考虑价格战。首先介绍伯川德（Bertrand）寡头模型价格竞争寡头的博弈模型前提假设：产品有一定差别，即产品之间有很强的替代性，但又不是完全替代，即价格不同时，价格较高的不会完全销不出去。设两个厂商的需求函数分别为： d1,d2为产品的替代系数则它们的利润函数分别为：从而可得它们的反应函数分别为：解出设贴现因子为δ。pi(t)表示企业i 在t期的价格，表示企业价格，则其利润现值为：令：企业i 的合谋利润；：企业i 的Bertrand竞争利润；：企业j遵守合谋定价，企业i 违背时的利润；则有：坦白抵赖坦白抵赖 -8，-8 0，-10 -10，0 -1，-1 （参考“囚犯困境”，相当于0-1-8）下面分析企业i 何时背离，何时合谋？考虑企业i在时期背离，企业j 随之进行Bertrand竞争以惩罚i ，于是企业i的最佳反应也是进行Bertrand竞争。则其利润现值为：企业i一直合谋的利润现值为：时，企业i 不值得背离。当结论：当时冷酷战略促使合谋得以维持。 “同时”是一个信息概念,而不是一个时间概念。一、动态博弈与静态博弈的区别静态博弈：所有局中人同时行动；或行动虽有先后，但没有人在自己行动之前观测到别人的行动。

您可能关注的文档

文档评论（0）

qiwqpu54 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第三章完全信动态博弈.pptVIP