博弈论:商业竞合之道教学课件5.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论之 重复博弈5.1 有限阶段的重复博弈单次博弈若重复会怎样?考虑著名的“囚徒困境”问题该博弈存在唯一的纳什均衡(坦白、坦白)如果重复多次,双方会不会有所改变(比如培养一个好的声誉)?按照逆向归纳法,假设囚徒困境重复K次,那么在最后一次,双方若按照理性策略准则,会选择均衡策略“坦白”回滚到在K-1次,无论此次选择什么,最后一次结果为(坦白,坦白),那么此时依然选择(坦白,坦白)…由此到第一阶段,双方依然选择坦白连锁店悖论连锁店悖论(Chain-store paradox,泽尔腾)单次博弈中,子博弈完美均衡是(进入,合作)如果该博弈重复多次(比如20次),结果会怎样?每次博弈结局相当于单次博弈结果重复20次(与常识不符)。不进入进入合作5,02,2反击5,00,0阶段博弈(Stage game) 一个博弈G若重复T次,则博弈G被称为阶段博弈,T次重复博弈可记为GT ……历史(History)? 若阶段博弈发生的时刻点记为0, 1, …, t, …则t时刻的“历史”是博弈各方在之前的每个阶段博弈中选择的“行动组合”序列ht = (a0,…, at-1) 。当t = 0时,定义历史h0 = 比如重复3次的囚徒困境博弈,在两个囚徒进行第三次阶段博弈时,可能的历史之一形如(抵赖,坦白) = h3(抵赖,抵赖)重复博弈的策略 参与人i在重复博弈中的策略,是参与人i在每一个阶段,针对该阶段的每一个可能历史,均给出相应行动的一个完整博弈方案 下图为3阶段重复囚徒困境博弈,参与人1的策略情况示意H2 = ?H1 = S ={CD,CC,DC,DD}?H0 = C or D?C or D?C or D?有限重复博弈的支付 对于有限重复博弈GT ,若不考虑收益的时间因素,则参与人i在重复博弈的收益,等于他在各阶段博弈支付的和,给定某个重复博弈策略组合前提下。 计算如下重复三次的囚徒困境博弈,参与人1的支付,阶段博弈为?(C, C)(C, D)(D, D)5 + 0 + 1 = 6有限重复博弈定理 对于有限阶段重复博弈GT,若阶段博弈存在唯一的子博弈完美纳什均衡(扩展式表述情况下)或唯一的纳什均衡(策略式表述下),则重复博弈唯一的子博弈完美均衡是:该阶段博弈的子博弈完美均衡重复T次。 以囚徒困境为例,若囚徒困境重复有限次,按照该定理,有限次重复的囚徒困境博弈的子博弈完美纳什均衡是,两个人在每个阶段均选择“坦白”。 “连锁店悖论”也是这个定理的推论。 如果阶段博弈存在多个纳什均衡时,有限重复博弈的子博弈完美纳什均衡会怎样呢? 阶段博弈纳什均衡不唯一时的有限重复博弈 如果阶段博弈存在多个纳什均衡,那么重复博弈会有多个子博弈完美均衡,而且,在某些阶段博弈中,参与人可能会选单次博弈中不会选择的非均衡策略。 因为单次博弈的“非理性”行动,放在全局中,可能会构成重复博弈的理性策略。 阶段博弈存在多个纳什均衡的有限重复博弈在单次博弈中,该博弈有两个纳什均衡(A,L)和(C,R),对应收益分别为(1,1)和(3,3)。但均帕累托劣于策略组合(B,M)(对应支付为(4,4))。考虑该博弈重复两次。在2次重复博弈中,我们构造一个双方的子博弈完美纳什均衡策略。??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3阶段博弈存在多个纳什均衡的有限重复博弈考虑如下推荐策略组合:参与人1在t = 0时,选择B在t = 1时,若历史为(B, M),选C,否则选A参与人2在t = 0时,选择M在t = 1时,若历史为(B, M),选R,否则选L可以验证,上述的策略组合为子博弈完美纳什均衡(彼此策略互为最优反应)??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3阶段博弈存在多个纳什均衡的有限重复博弈??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3双方坚持推荐策略,参与人2的收益为7??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3阶段博弈存在多个纳什均衡的有限重复博弈??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3双方坚持推荐策略,参与人2的收益为7??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3阶段博弈存在多个纳什均衡的有限重复博弈??参与人2??LMR参与人1A1, 15, 00, 0B0, 54, 40, 0C0, 00, 03, 3双方坚持推荐策略,参与人2的收益为7若参与人2在第一阶段选择L,参与人2的收益为6??参与人2??

文档评论(0)

allen734901 + 关注
实名认证
文档贡献者

副教授持证人

知识共享

领域认证该用户于2024年11月14日上传了副教授

1亿VIP精品文档

相关文档