四川大学骆帧博弈论与经济分析(完全信息动态).doc

四川大学骆帧博弈论与经济分析(完全信息动态).doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
四川大学骆帧博弈论与经济分析(完全信息动态)

博弈论与经济分析(完全信息动态) 骆桢 四川大学经济学院 第二章 完全信息动态 动态博弈要件及其表述形式 要件:1、完全信息静态:参与人、策略、得益 2、动态:参与人、阶段、行动、策略(每个阶段的全部计划)、得益 扩展型(extensive form):借钱博弈(附加介绍“节点”与“阶段”的区别) 分 不分 借,打 2,2 -1,0 借,不打 2,2 0,4 不借,打 1,0 1,0 不借,不打 1,0 1,0 囚徒困境? 第二节 置信问题及逆向归纳法(子博弈与子博弈完美纳什均衡) 按划线法,“借钱博弈”的纳什均衡有:(借,告;分)(不借,告;不分)(不借,不告;不分)。但是……威胁不可置信(借,告;分)不具有稳定性。 逆向归纳排除不可置信的“承诺”或者是“威胁”,直观上意味着,参与者作为理性人应该考虑对手在后续阶段的选择。 理性要求:双方理性必须是公共知识,回忆“反复删去严格劣策略” 如果1在第一阶段不选B,而选了A,他还是不是理性的呢? 仍然有可能,但这个时候,理性不可能是“公共知识”,可能的情况包括:“1是理性的”是公共知识,但是1认为2是不理性的,于是他选择……期待……;或者“2是理性的”是公共知识,1是理性的,但是1认为2不知道自己是理性的,于是选A,希望2上当。 (和后面顺序归纳法对比,为什么这里不存在顺序归纳法的解) 子博弈与子博弈完美纳什均衡(SPNE):一个不正式的说明: 子博弈:由一个动态博弈第一个阶段以外的某个阶段开始的后续博弈构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分。 SPNE:如果一个策略组合在整个动态博弈和所有子博弈中都构成NE,那么这个策略组合称为该动态博弈的SPNE。 (注意,构成SPNE的策略中,很多节点的行为不在“均衡路径”上,简单介绍“均衡路径”) SPNE是对动态博弈中多个NE进行精炼。 例子: 1、两阶段动态完全且完美信息动态博弈 该类模型的一般性描述: 参与人1从可行集A1中选择行动a1(为什么不是s1了?注意“策略”在动态博弈中含义的变化) 参与人2观察到a1之后从可行集A2中选择行动a2 两人的收益分别为u1(a1,a2)和u2(a1,a2) 完全且完美信息动态博弈的特点:行动是顺序发生的;下一步选择之前,所有以前的行动都是可以被观察到的;每一可能的行动组合下参与者的收益都是共同知识。 求解方法:逆向归纳 当参与人2行动时,能看见参与人1的选择,于是 假定A1中的每一个a1,参与人2的最优化问题只有唯一解,用其反应函数表示R2(a1)。因为参与人1能像参与人2一样解出这个问题,因此他能预测到2的反应,于是 假定这个规划也有唯一的解,我们称是这一博弈的逆向归纳解。 (后面我们将严格定义子博弈完美纳什均衡,只有不含不可置信威胁的NE才是SPNE) 例1:斯塔克伯格模型 古诺模型中,一个企业作为领导者先行选择(伯川德模型的先后选择作为习题): 企业1选择产量q1,企业2观察到产量q1,选择产量q2,企业i的利润由以下函数给出: 其中,且 (先行者优势;如果存在先后顺序,但是企业2观察不到q1,退化为古诺模型,为什么?) 按照逆向归纳的思路,先考虑企业2在看到企业1的任意产量之后的最优反应: 由一阶条件(二阶条件略)可得: 厂商1预计到厂商2会做这样的反应,于是,在第一阶段厂商1最优化的问题则变成: 由一阶条件(二阶条件略)可得: 代入可得 代入求得,这是先行者优势的体现。 例2:有工会企业的工资和就业 例3:讨价还价模型 三回合 2、无限回合(一个非正式的讨论) 结论和三回合对比,1不再具有强制性“优势” 为什么一定要用三阶段?(或者说奇数阶段,偶数,比如2或者4不行吗?) 例4:委托代理模型 (i)无不确定性 委托人选择提供一份怎样的合同{W(E),W(S)};代理人选择接不接受这份合同,然后选择“努力”E还是“偷懒”S。因为没有不确定性,所以产出是代理人努力的函数R(E)或者R(S). 完全且完美信息,进行逆向归纳: 若W(E)-EW(S)-S,则代理人会选择努力,这个条件称为“激励相容约束” 而上一阶段代理人是否会接受呢? 若W(E)-E0则代理人会接受,这个条件称为“参与相容约束” 当然,需要R(E)-W(E)R(0)委托然才选择委托。 (ii)有不确定性但可监督 努力与否可以看得到并可证实,则通常工资取决于代理人的努力而不是工作成果。这样一来,若产出除了代理人的努力之外还存在着不确定性,那么风险就由委托人全部承担。即风险仅影响委托人的行为,不影响代理人的行为。假设R(0)=0,并引入“自然”参与者0来表示风险。假设有10和20两种可能的产出。 因为风险不影响代理人的行为,则 若W(E)-EW(S)-S,则代理人

文档评论(0)

shenlan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档