哈工大博弈论第7讲2013方案.ppt

下载文档 降价啦

10
0
约9.6千字
约 74页
2016-05-26 发布于湖北
举报
版权申诉
保障服务

哈工大博弈论第7讲2013方案.ppt

1、本文档共74页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* 重复博弈囚徒困境问题与市场进入博弈类似，只要博弈的重复次数是有限的，最后阶段博弈的唯一纳什均衡是两个囚徒都选择坦白，且“总是坦白”是唯一的子博弈精炼均衡。上述结果可以一般化为下述定理。定理：令G是阶段博弈，G(T)是G重复T次的重复博弈(T<∞)。那么，如果G有唯一的纳什均衡，重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次（即每个阶段博弈出现的都是一次性博弈的均衡结果）。 * 重复博弈上述定理说明，只要博弈的重复次数是有限的，重复本身并不改变囚徒困境的均衡结果。上述定理中“唯一性”是一个重要条件。如果纳什均衡不是唯一的，上述结论就不一定成立。当博弈有多个纳什均衡时，参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为。 * 重复博弈前述连锁店悖论的一个解释是引入信息的不完全性。在不完全信息动态博弈中，可以看到这一点。这里先给出一个解释模型，即当博弈重复无穷多次而不是有限次时，存在着完全不同于一次博弈的子博弈精炼均衡。以囚徒问题为例，对此进行说明。 * 重复博弈为便于讨论，将囚徒问题复制于此，见图2-27。可以证明，如果参与人有足够的耐心，（抵赖，抵赖）是一个子博弈精炼纳什均衡结果。图2-27 囚徒困境问题坦白抵赖坦白 -8，-8 0，-10 抵赖 -10, 0 -1,-1 囚徒2 囚徒1 * 考虑下列所谓的“冷酷战略”(grim strategies): 开始时选择抵赖；选择抵赖直到有一方选择了坦白，然后永远选择坦白。重复博弈图2-27 囚徒困境问题坦白抵赖坦白 -8，-8 0，-10 抵赖 -10, 0 -1,-1 囚徒2 囚徒1 * 重复博弈首先证明冷酷战略是一个纳什均衡回顾一下，所谓纳什均衡，就是这样的一个状态，对于任意一个参与人，给定其他参与人选择纳什均衡策略，该参与人都无法偏离纳什均衡策略使自己受益。因此，证明囚徒问题中冷酷战略是一个纳什均衡的方法是：给定其中任意一个参与人坚持“冷酷战略”，另外一个参与人的最优选择也是坚持冷酷战略。 * 重复博弈设a为贴现因子（假定两人贴现因子相同）。如果i在博弈的某个阶段首先选择了坦白，在该阶段得到0单位的支付，优于选择抵赖得到的-1。但这个机会主义行为将触发他的伙伴选择“永远坦白”的惩罚，因此i随后每个阶段的支付都是-8。因此，如果下列条件满足，给定对手没有选择坦白，i将不会选择坦白即 * 重复博弈该式可以化简为 a ≥ 1/8 同样道理，若对手首先选择了坦白，不论a的值为多少，参与人i都有积极性坚持冷酷战略。因此，冷酷战略是一个纳什均衡。 * 重复博弈该战略是否是子博弈精炼均衡？因为博弈重复无限次，从任何一个阶段开始的子博弈与这个博弈的结构完全相同。在冷酷战略均衡下，子博弈可以分为两类：在类型a，没有任何参与人曾经坦白；在类型b，至少有一个参与人曾经坦白。 * 重复博弈在类型a中，我们已经证明，冷酷战略在a类型子博弈中构成纳什均衡；在b类子博弈中，根据冷酷战略，参与人只是重复单阶段博弈的纳什均衡，因此也是子博弈的纳什均衡。因此，如果a ≥ 1/8，冷酷战略是无限次囚徒博弈的一个子博弈精炼纳什均衡。 * 重复博弈该博弈还有许多其他子博弈精炼均衡。各期都坦白，是另一个子博弈精炼纳什均衡子博弈精炼均衡的多重性是无限次重复博弈的普遍问题。找出全部子博弈；求解子博弈精练纳什均衡和博弈的结果。 * * 多阶段静态博弈模型一例博弈中有四个参与人，分别用参与人1~4表示。第一阶段是参与人1与2的决策选择阶段，他们同时在各自的策略集A1和A2中分别选择a1和a2。第二阶段是参与人3与4决策选择阶段，他们看到参与人1和2的决策a1和a2后，同时在各自的策略集A3, A4中分别选择a3和a4。各参与人的支付函数是参与人的策略a1, a2, a3, a4的函数，记为ui = ui (a1, a2, a3, a4) * 多阶段静态博弈有同时选择的动态博弈问题如国际竞争中最优关税博弈问题，两个制定关税的国家可看成标准模型中的参与人1与2；两国各自的一个相互进行产量竞争的企业就是模型中的参与人3于4。上述标准模型的变形，如某个阶段只有一个参与人；第二阶段的参与人3于4与第一阶段的参与人1与2相同等，也属于同时选择的动态博弈问题。 * 多阶段静态博弈这类模型实质上就是完美信息动态博弈，因此仍然可以采用逆推归纳法进行分析。因为存在同时选择，因此每个阶段不再是单人优化问题，而是一个静态博弈。 * 多阶段静态博弈简例：挤兑博弈问题描述：银行信贷对社会经济发展的作用无可估量，但它在带来巨大利益的同时也蕴含着一定的风险。设一家银行为了给一个企业贷放