- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6.4讲:RepeatedGames(IV):以“三价博弈”为例报告
三价博弈的两次重复博弈(续) 总结: * 子博弈完美纳什均衡路径 两次重复博弈实现的总得益组合 1:{(M,M),(M,M)} (3+3δ,3+3δ) 2:{(L,L),(M,M)} (1+3δ,1+3δ) 3:{(M,M),(L,L)} (3+δ,3+δ) 4:{(L,L),(L,L)} (1+δ,1+δ) 5:触发策略实现的博弈路径 (5+3δ,5+3δ) 三价博弈的两次重复博弈(续) 触发策略: 博弈方1:第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 博弈方2:同博弈方1。 * 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 三价博弈的两次重复博弈(续) 触发策略实现的可能博弈路径 {(H,H) , (M,M)} {非(H,H)策略组合 , (L,L)} * 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 三价博弈的两次重复博弈(续) 当δ1/2时,触发策略实现的博弈路径必为{(H,H), (M,M)}, 是一个子博弈完美纳什均衡。 首先,考察最后一个阶段(即第二次重复)的博弈结果。 触发策略实现的可能博弈路径为 {(H,H), (M,M)}或{非(H,H)策略组合, (L,L)}。 也就是说,在触发策略组合下,第二次重复的博弈结果不外乎是(M,M)或(L,L)。这两种博弈结果都是纳什均衡! * 第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 三价博弈的两次重复博弈(续) 其次,考察倒数第二阶段(即第一次重复)的博弈结果。 基于对第二次重复的博弈结果分析,得到两博弈方在第一次重复博弈时的得益矩阵。利用划线法不难发现(M,M)和(L,L)均为纳什均衡。 * 厂商2 H M L 厂 商 1 H 5+3δ,5+3δ 0+δ,6+δ 0+δ,2+δ M 6+δ,0+δ 3+δ,3+δ 0+δ,2+δ L 2+δ,0+δ 2+δ,0+δ 1+δ,1+δ 三价博弈的两次重复博弈(续) 为使得(H,H)为纳什均衡,那么需要: * 厂商2 H M L 厂 商 1 H 5+3δ,5+3δ 0+δ,6+δ 0+δ,2+δ M 6+δ,0+δ 3+δ,3+δ 0+δ,2+δ L 2+δ,0+δ 2+δ,0+δ 1+δ,1+δ 三价博弈的两次重复博弈(续) 很显然,当δ1/2时,5+3δ6+δ3+δ1+δ 。 所以,当δ1/2时,纳什均衡(H,H)实现的是两博弈方的最佳得益,因此两博弈方必然会采用它! * 厂商2 H M L 厂 商 1 H 5+3δ,5+3δ 0+δ,6+δ 0+δ,2+δ M 6+δ,0+δ 3+δ,3+δ 0+δ,2+δ L 2+δ,0+δ 2+δ,0+δ 1+δ,1+δ 三价博弈的两次重复博弈(续) 总结: * 子博弈完美纳什均衡路径 两次重复博弈实现的总得益组合 1:{(M,M),(M,M)} (3+3δ,3+3δ) 2:{(L,L),(M,M)} (1+3δ,1+3δ) 3:{(M,M),(L,L)} (3+δ,3+δ) 4:{(L,L),(L,L)} (1+δ,1+δ) 5:触发策略实现的{(H,H), (M,M)}, (5+3δ,5+3δ) 三价博弈的两次重复博弈(续) ?当δ1/2时,策略组合5(触发策略)为什么能够实现较有效的总得益组合呢 原因在于它具有“报复机制”。 * 三价博弈的两次重复博弈(续) 在触发策略下,在第一个重复阶段,给定博弈方2选择H,如果博弈方1不选择H,而选择M,得益增加1单位;但这个偏离后果是他在第二阶段的得益将由3单位下降为1单位。这样,如果1(3-1)δ(即δ1/2),博弈方1偏离(H,H)是得不偿失的,他将没有积极性偏离。同理,当δ1/2时,博弈方2也将没有积极性偏离(H,H)。 * 厂商2 H M L 厂 商 1 H 5,5 0,6 0,2 M 6,0 3,3 0,2 L 2,0 2,0 1,1 第一次选择H;如果第一次博弈的结果为(H,H),则在第二次博弈时选择M,如果第一次博弈的结果为其他策略组合,则在第二次博弈时选择L。 三价博弈的两次重复博弈(续) 触发策略 触发策略实际上是一种典型的策略。在这类典型策略中,两博
您可能关注的文档
最近下载
- 2022年北京市十二中初三(上)期中数学试卷及答案.pdf VIP
- 鲁教版初中九年级化学各章节知识点归纳复习提纲.doc
- 海鲜市场项目可行性研究幻灯片.pptx VIP
- 微电网能量管理:技术、策略与发展路径探究.docx VIP
- 某污水处理工艺设备安装施工方案.docx VIP
- 理智与情感:爱情的心理文化之旅 智慧树网课章节测试答案.docx VIP
- 03.1 20CS03-1 一体化预制泵站选用与安装(一).docx VIP
- 2025年公司组织架构图及各部门职能要求模板参考(架构图可编辑).pdf VIP
- 级配碎石施工技术课件.ppt VIP
- 神话传说故事与中国文化 智慧树 知到答案.docx VIP
文档评论(0)