第三章扩展型博弈论.pptVIP

下载本文档

135
0
约 43页
2016-11-27 发布于河南
举报
版权申诉

第三章扩展型博弈论.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四节重复博弈单次博弈重复进行构成的博弈过程，但博弈方的行为和博弈结果不一定是单次博弈的简单重复，其中，单次博弈可称为阶段博弈重复博弈的基本特征：单次博弈之间没有实质联系，即前一阶段的博弈不改变其它阶段的博弈结构；所有局中人能够观测并记忆以往的博弈历史；局中人的总支付为各阶段支付的贴现值之和或者加权平均值。重复博弈的分类：有限次博弈由单次博弈的有限次重复构成的重复博弈，有明确的重复次数或结束时间无限次博弈由单次博弈一直重复进行下去的重复博弈，没有可以预见的结束时间，各博弈方主观上认为博弈会不断进行下去企业甲（在位者）在20个相同的市场各开了一家连锁店，每个市场有一个潜在进入者，每个进入者序贯决定是否进入相应市场，企业甲对各个市场的进入者选择默认或者打压策略，忽略进入者之间的微小差异，这个问题可以看成是一个20次（阶段）重复博弈。（0，300）默认进入者 E N 打压甲（40，50）（-10，0）思考：在位者是否应对开头几个市场的进入者采取打击策略，使打击的示范效应吓退其他市场的潜在进入者，从而能够独享其余市场的利益？子博弈完美纳什均衡为：在位者在每一个市场选择默许，进入者在每一个市场选择进入。以阶段博弈G构成的重复T次（T ∞）的重复博弈中，如果G中仅存在唯一的纳什均衡，那么重复博弈G(T)的唯一子博弈完美均衡是阶段博弈的唯一纳什均衡重复T次，即每次博弈结局都是该纳什均衡。乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 支付函数的表达——贴现因子贴现因子在数值上可以理解为贴现率，就是1个份额经过一段时间后所等同的现在份额。设局中人的支付函数为 ,并且在第t(t=1,2,…)次阶段博弈中获得的阶段博弈支付是，则冷酷策略也称作触发策略，以囚徒困境为例：开始选择“不坦白”，一旦对手“坦白”，那么以后永远选择“坦白”。思考：局中人都选择冷酷策略时是否会构成一个子博弈完美纳什均衡？乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 （1）若之前没有人选“坦白”， A若选“坦白”，该阶段得益为-1，但此举将触发B之后永远的报复，即B在之后永远选“坦白”，A在之后也只能永远选“坦白”，其总得益贴现最多为 A若选“不坦白”，并且之后每阶段都选“不坦白”时，B之后也会配合，即每阶段都选“不坦白”，A总得益贴现为当时，A选“不坦白”是最优的，即给定囚徒B选择冷酷策略，证明囚徒A选择冷酷策略是最优的。当时，A在没有人先选“坦白”时选“不坦白”是最优的，并且A在之后每阶段都选“不坦白”是最优的选择。乙甲坦白不坦白坦白 -6，-6 -1，-8 不坦白 -8，-1 -2，-2 （2）若之前有人选“坦白”， B若在之前选了“坦白”，则B之后会永远选“坦白”，显然，给定B在此时及之后永远选“坦白”，A在此时及之后都选“坦白”是最优的。 A若在之前选了“坦白”，则B在此时及以后必一直选“坦白”，故A在此时及以后一直选“坦白”是最优的。综上，给定B选冷酷策略，A选冷酷策略是最优的。由对称性可知，当A选冷酷策略时，B选冷酷策略也是最优的。在无限次重复博弈里，如果博弈者有足够长远的利益考虑，给定对方表现出合作的行为，自己采用合作行为对自己是最优的，而一旦自己表现出了合作行为，对方也继续合作对于对方也仍然是最优的，这样，合作均衡就出现了。第三章扩展型博弈授课人: 吴昱设有k=1堆硬币，各堆分别含有N1，N2，……NK枚。游戏法则如下： 1．两个游戏人交替进行游戏； 2．当轮到每个游戏人取子时，选择这些堆中的一堆，并从所选的堆中取走至少一枚硬币（可以取走所选堆中的全部硬币）； 3．如果轮到某个游戏人时所有的硬币堆都已经被拿空了，则判负。第一节扩展型博弈的含义及其表示在完全信息博弈中，局中人的行动有先有后，后行动者可以观察到先行动者的行动，又可称为完全信息动态博弈，或者序贯博弈。只剩一张门票免费发送，先到先得，若得到效用都为100。甲、乙二人可以选择两种交通工具，B或T，B需要花5个单位，T需要花50个单位。假设甲先下班先行动，乙可以观察到甲的行动选择后行动。博弈树（1）同一个局中人的一些结点构成的集合；（2）表示博弈到了这个集合，但不知到了这个集合的哪一个结点上。决策结：局中人采取行动的时点初始

您可能关注的文档

文档评论（0）

qbjzmxj5904 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第三章扩展型博弈论.pptVIP