第6.4讲：RepeatedGames(IV)：以“三价博弈”为例报告.pptVIP

下载本文档

11
0
约4.83千字
约 31页
2017-01-19 发布于湖北
举报
版权申诉

第6.4讲：RepeatedGames(IV)：以“三价博弈”为例报告.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第6.4讲：RepeatedGames(IV)：以“三价博弈”为例报告

三价博弈的两次重复博弈（续）总结： * 子博弈完美纳什均衡路径两次重复博弈实现的总得益组合 1：{（M，M），（M，M）} （3+3δ，3+3δ） 2：{（L，L），（M，M）} （1+3δ，1+3δ） 3：{（M，M），（L，L）} （3+δ，3+δ） 4：{（L，L），（L，L）} （1+δ，1+δ） 5：触发策略实现的博弈路径（5+3δ，5+3δ）三价博弈的两次重复博弈（续）触发策略：博弈方1：第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。博弈方2：同博弈方1。 * 厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 三价博弈的两次重复博弈（续）触发策略实现的可能博弈路径 {(H,H) , (M,M)} {非(H,H)策略组合， (L,L)} * 厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。三价博弈的两次重复博弈（续）当δ1/2时,触发策略实现的博弈路径必为{(H,H)， (M,M)}, 是一个子博弈完美纳什均衡。首先，考察最后一个阶段（即第二次重复）的博弈结果。触发策略实现的可能博弈路径为｛(H,H)， (M,M)｝或｛非(H,H)策略组合， (L,L)｝。也就是说，在触发策略组合下，第二次重复的博弈结果不外乎是（M,M）或（L,L）。这两种博弈结果都是纳什均衡！ * 第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 三价博弈的两次重复博弈（续）其次，考察倒数第二阶段（即第一次重复）的博弈结果。基于对第二次重复的博弈结果分析，得到两博弈方在第一次重复博弈时的得益矩阵。利用划线法不难发现（M，M）和（L，L）均为纳什均衡。 * 厂商2 H M L 厂商 1 H 5+3δ，5+3δ 0+δ，6+δ 0+δ，2+δ M 6+δ，0+δ 3+δ，3+δ 0+δ，2+δ L 2+δ，0+δ 2+δ，0+δ 1+δ，1+δ 三价博弈的两次重复博弈（续）为使得（H，H）为纳什均衡，那么需要： * 厂商2 H M L 厂商 1 H 5+3δ，5+3δ 0+δ，6+δ 0+δ，2+δ M 6+δ，0+δ 3+δ，3+δ 0+δ，2+δ L 2+δ，0+δ 2+δ，0+δ 1+δ，1+δ 三价博弈的两次重复博弈（续）很显然，当δ1/2时，5+3δ6+δ3+δ1+δ 。所以，当δ1/2时，纳什均衡（H，H）实现的是两博弈方的最佳得益，因此两博弈方必然会采用它！ * 厂商2 H M L 厂商 1 H 5+3δ，5+3δ 0+δ，6+δ 0+δ，2+δ M 6+δ，0+δ 3+δ，3+δ 0+δ，2+δ L 2+δ，0+δ 2+δ，0+δ 1+δ，1+δ 三价博弈的两次重复博弈（续）总结： * 子博弈完美纳什均衡路径两次重复博弈实现的总得益组合 1：{（M，M），（M，M）} （3+3δ，3+3δ） 2：{（L，L），（M，M）} （1+3δ，1+3δ） 3：{（M，M），（L，L）} （3+δ，3+δ） 4：{（L，L），（L，L）} （1+δ，1+δ） 5：触发策略实现的{(H,H)， (M,M)}, （5+3δ，5+3δ）三价博弈的两次重复博弈（续）？当δ1/2时，策略组合5（触发策略）为什么能够实现较有效的总得益组合呢原因在于它具有“报复机制”。 * 三价博弈的两次重复博弈（续）在触发策略下，在第一个重复阶段，给定博弈方2选择H，如果博弈方1不选择H，而选择M，得益增加1单位；但这个偏离后果是他在第二阶段的得益将由3单位下降为1单位。这样，如果1（3-1）δ（即δ1/2），博弈方1偏离（H，H）是得不偿失的，他将没有积极性偏离。同理，当δ1/2时，博弈方2也将没有积极性偏离（H，H）。 * 厂商2 H M L 厂商 1 H 5，5 0，6 0，2 M 6，0 3，3 0，2 L 2，0 2，0 1，1 第一次选择H；如果第一次博弈的结果为（H，H），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择L。三价博弈的两次重复博弈（续）触发策略触发策略实际上是一种典型的策略。在这类典型策略中，两博