第三章 扩展型博弈论.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四节 重复博弈 单次博弈重复进行构成的博弈过程,但博弈方的行为和博弈结果不一定是单次博弈的简单重复,其中,单次博弈可称为阶段博弈 重复博弈的基本特征: 单次博弈之间没有实质联系,即前一阶段的博弈不改变其它阶段的博弈结构; 所有局中人能够观测并记忆以往的博弈历史; 局中人的总支付为各阶段支付的贴现值之和或者加权平均值。 重复博弈的分类: 有限次博弈 由单次博弈的有限次重复构成的重复博弈,有明确的重复次数或结束时间 无限次博弈 由单次博弈一直重复进行下去的重复博弈,没有可以预见的结束时间,各博弈方主观上认为博弈会不断进行下去 企业甲(在位者)在20个相同的市场各开了一家连锁店,每个市场有一个潜在进入者,每个进入者序贯决定是否进入相应市场,企业甲对各个市场的进入者选择默认或者打压策略,忽略进入者之间的微小差异,这个问题可以看成是一个20次(阶段)重复博弈。 (0,300) 默认 进入者 E N 打压 甲 (40,50) (-10,0) 思考:在位者是否应对开头几个市场的进入者采取打击策略,使打击的示范效应吓退其他市场的潜在进入者,从而能够独享其余市场的利益? 子博弈完美纳什均衡为:在位者在每一个市场选择默许,进入者在每一个市场选择进入。 以阶段博弈G构成的重复T次(T ∞)的重复博弈中,如果G中仅存在唯一的纳什均衡,那么重复博弈G(T)的唯一子博弈完美均衡是阶段博弈的唯一纳什均衡重复T次,即每次博弈结局都是该纳什均衡。 乙 甲 坦白 不坦白 坦白 -6,-6 -1,-8 不坦白 -8,-1 -2,-2 支付函数的表达——贴现因子 贴现因子在数值上可以理解为贴现率,就是1个份额经过一段时间后所等同的现在份额。 设局中人的支付函数为 ,并且在第t(t=1,2,…)次阶段博弈中获得的阶段博弈支付是 ,则 冷酷策略 也称作触发策略,以囚徒困境为例:开始选择“不坦白”,一旦对手“坦白”,那么以后永远选择“坦白”。 思考:局中人都选择冷酷策略时是否会构成一个子博弈完美纳什均衡? 乙 甲 坦白 不坦白 坦白 -6,-6 -1,-8 不坦白 -8,-1 -2,-2 (1) 若之前没有人选“坦白”, A若选“坦白”,该阶段得益为-1,但此举将触发B之后永远的报复,即B在之后永远选“坦白”,A在之后也只能永远选“坦白”,其总得益贴现最多为 A若选“不坦白”,并且之后每阶段都选“不坦白”时,B之后也会配合,即每阶段都选“不坦白”,A总得益贴现为 当 时,A选“不坦白”是最优的,即 给定囚徒B选择冷酷策略,证明囚徒A选择冷酷策略是最优的。 当 时,A在没有人先选“坦白”时选“不坦白”是最优的,并且A在之后每阶段都选“不坦白”是最优的选择。 乙 甲 坦白 不坦白 坦白 -6,-6 -1,-8 不坦白 -8,-1 -2,-2 (2) 若之前有人选“坦白”, B若在之前选了“坦白”,则B之后会永远选“坦白”,显然,给定B在此时及之后永远选“坦白”,A在此时及之后都选“坦白”是最优的。 A若在之前选了“坦白”,则B在此时及以后必一直选“坦白”,故A在此时及以后一直选“坦白”是最优的。 综上,给定B选冷酷策略,A选冷酷策略是最优的。由对称性可知,当A选冷酷策略时,B选冷酷策略也是最优的。 在无限次重复博弈里,如果博弈者有足够长远的利益考虑,给定对方表现出合作的行为,自己采用合作行为对自己是最优的,而一旦自己表现出了合作行为,对方也继续合作对于对方也仍然是最优的,这样,合作均衡就出现了。 第三章 扩展型博弈 授课人: 吴昱设有k=1堆硬币,各堆分别含有N1,N2,……NK枚。游戏法则如下: 1.两个游戏人交替进行游戏; 2.当轮到每个游戏人取子时,选择这些堆中的一堆,并从所选的堆中取走至少一枚硬币(可以取走所选堆中的全部硬币); 3.如果轮到某个游戏人时所有的硬币堆都已经被拿空了,则判负。 第一节 扩展型博弈的含义及其表示 在完全信息博弈中,局中人的行动有先有后,后行动者可以观察到先行动者的行动,又可称为完全信息动态博弈,或者序贯博弈。 只剩一张门票免费发送,先到先得,若得到效用都为100。甲、乙二人可以选择两种交通工具,B或T,B需要花5个单位,T需要花50个单位。假设甲先下班先行动,乙可以观察到甲的行动选择后行动。 博弈树 (1)同一个局中人的一些结点构成的集合; (2)表示博弈到了这个集合,但不知到了这个集合的哪一个结点上。 决策结:局中人采取行动的时点 初始

文档评论(0)

qbjzmxj5904 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档