四川大学骆帧博弈论与经济分析(完全信息动态).doc

下载文档 降价啦

6
0
约8.85千字
约 14页
2017-09-04 发布于重庆
举报
版权申诉
保障服务

四川大学骆帧博弈论与经济分析(完全信息动态).doc

1、本文档共14页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

四川大学骆帧博弈论与经济分析(完全信息动态)

博弈论与经济分析（完全信息动态）骆桢四川大学经济学院第二章完全信息动态动态博弈要件及其表述形式要件:1、完全信息静态：参与人、策略、得益 2、动态：参与人、阶段、行动、策略（每个阶段的全部计划）、得益扩展型（extensive form）：借钱博弈（附加介绍“节点”与“阶段”的区别）分不分借，打 2,2 -1,0 借，不打 2,2 0,4 不借，打 1,0 1,0 不借，不打 1,0 1,0 囚徒困境？第二节置信问题及逆向归纳法（子博弈与子博弈完美纳什均衡）按划线法，“借钱博弈”的纳什均衡有：（借，告；分）（不借，告；不分）（不借，不告；不分）。但是……威胁不可置信（借，告；分）不具有稳定性。逆向归纳排除不可置信的“承诺”或者是“威胁”，直观上意味着，参与者作为理性人应该考虑对手在后续阶段的选择。理性要求：双方理性必须是公共知识，回忆“反复删去严格劣策略” 如果1在第一阶段不选B，而选了A，他还是不是理性的呢？仍然有可能，但这个时候，理性不可能是“公共知识”，可能的情况包括：“1是理性的”是公共知识，但是1认为2是不理性的，于是他选择……期待……；或者“2是理性的”是公共知识，1是理性的，但是1认为2不知道自己是理性的，于是选A，希望2上当。（和后面顺序归纳法对比，为什么这里不存在顺序归纳法的解）子博弈与子博弈完美纳什均衡（SPNE）：一个不正式的说明：子博弈：由一个动态博弈第一个阶段以外的某个阶段开始的后续博弈构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分。 SPNE：如果一个策略组合在整个动态博弈和所有子博弈中都构成NE，那么这个策略组合称为该动态博弈的SPNE。（注意，构成SPNE的策略中，很多节点的行为不在“均衡路径”上，简单介绍“均衡路径”） SPNE是对动态博弈中多个NE进行精炼。例子： 1、两阶段动态完全且完美信息动态博弈该类模型的一般性描述：参与人1从可行集A1中选择行动a1（为什么不是s1了？注意“策略”在动态博弈中含义的变化）参与人2观察到a1之后从可行集A2中选择行动a2 两人的收益分别为u1（a1，a2）和u2（a1，a2）完全且完美信息动态博弈的特点：行动是顺序发生的；下一步选择之前，所有以前的行动都是可以被观察到的；每一可能的行动组合下参与者的收益都是共同知识。求解方法：逆向归纳当参与人2行动时，能看见参与人1的选择，于是假定A1中的每一个a1，参与人2的最优化问题只有唯一解，用其反应函数表示R2（a1）。因为参与人1能像参与人2一样解出这个问题，因此他能预测到2的反应，于是假定这个规划也有唯一的解，我们称是这一博弈的逆向归纳解。（后面我们将严格定义子博弈完美纳什均衡，只有不含不可置信威胁的NE才是SPNE）例1：斯塔克伯格模型古诺模型中，一个企业作为领导者先行选择（伯川德模型的先后选择作为习题）：企业1选择产量q1，企业2观察到产量q1，选择产量q2，企业i的利润由以下函数给出：其中，且（先行者优势；如果存在先后顺序，但是企业2观察不到q1，退化为古诺模型，为什么？）按照逆向归纳的思路，先考虑企业2在看到企业1的任意产量之后的最优反应：由一阶条件（二阶条件略）可得：厂商1预计到厂商2会做这样的反应，于是，在第一阶段厂商1最优化的问题则变成：由一阶条件（二阶条件略）可得：代入可得代入求得，这是先行者优势的体现。例2：有工会企业的工资和就业例3：讨价还价模型三回合 2、无限回合（一个非正式的讨论）结论和三回合对比，1不再具有强制性“优势” 为什么一定要用三阶段？（或者说奇数阶段，偶数，比如2或者4不行吗？）例4：委托代理模型（i）无不确定性委托人选择提供一份怎样的合同{W(E),W(S)}；代理人选择接不接受这份合同，然后选择“努力”E还是“偷懒”S。因为没有不确定性，所以产出是代理人努力的函数R(E)或者R(S). 完全且完美信息，进行逆向归纳：若W(E)-EW(S)-S，则代理人会选择努力，这个条件称为“激励相容约束” 而上一阶段代理人是否会接受呢？若W(E)-E0则代理人会接受，这个条件称为“参与相容约束” 当然，需要R(E)-W(E)R(0)委托然才选择委托。（ii）有不确定性但可监督努力与否可以看得到并可证实，则通常工资取决于代理人的努力而不是工作成果。这样一来，若产出除了代理人的努力之外还存在着不确定性，那么风险就由委托人全部承担。即风险仅影响委托人的行为，不影响代理人的行为。假设R(0)=0，并引入“自然”参与者0来表示风险。假设有10和20两种可能的产出。因为风险不影响代理人的行为，则若W(E)-EW(S)-S，则代理人