[经济学]第十二讲重复博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[经济学]第十二讲重复博弈

第十二讲 重复博弈 第一节 有限次重复博弈 一、重复博弈的特征 (一)每一阶段博弈的结构完全相同。 (二)所有参与人都观测到博弈过去的历史。 (四)影响均衡结果的主要因素是重复次数及信息的完备。 1、重复次数:当博弈重复多次 时,参与人可能为了长远利益而 牺牲眼前利益而选择不同的均衡策略。 2、信息的完备性. 当某个参与人的特征不为其他参与人所知时, 他有可能有积极性,建立一个“好”的声誉以换取长远利益。 二、有限次重复博弈 例1,企业定价策略 定理1.设G是价格博弈,G(T)是G重复博弈T, 如果G有唯一的纳什均衡, 则G(T)的唯一子博弈精 炼纳什均衡是G的纳什均衡 重复T次。 例2,掷硬币游戏 此博弈有唯一的混合策略纳什均衡 实验证明,它的确为最优的策略     第二节 无限次重复博弈 例3,无限次重复囚徒困境博弈。 第二节 无限次重复博弈 冷酷策略:(1)开始选择“抵赖” (2)如果有一方选择“坦白”,则然后永远选择“坦白”。 设δ为贴现因子,坚持冷酷策略条件: 一旦坦白的总收益u0≤坚持冷酷策略的总收益u* 这就说,i≤500%时,双方一定会坚持冷酷策略, 从而(抵赖,抵赖)为每一个阶段的均衡结果,且是帕累托最优的 。 其原因:如果博弈重复无穷次,且双 方有足够的耐心(对未来价值的估量较大),任何短期的机会主义行为的 所得都是微不足道的,参与人有积极 性为自己建立一个乐于合作的声誉和 惩罚对方的机会主义行为。 例4,无限重复的古诺特寡头竞争模型。 例4,无限重复的古诺特寡头竞争模型。 成本函数分别为C1(g1)=cg1 C2(g2)=cg2 反需求函数P=a-(g 1+g 2) 利润函数 ③i背叛,j合作时,i的最优生产量为 i的最优利润为 j 的冷酷策略: (1)首先选择合作即生产量为 (2)如果i选择背叛即生产量为, 则j将永远选择不合作。 企业i没有积极性偏离合作均衡的条件为 一直坚持合作的总收益≥背叛的总收益,即 即企业越多,合作越困难 企业越多企业一次性机会主义不合作行为中的净收益相对于长远利益的比率越大,机会主义行为 的诱惑越大。 一般说来,小团体的合作靠非正式的规则就可以维持, 而大团体则必须依赖于正式的规则和合约。 无名氏定理:有一个一次博弈G可作为某无穷博弈的一个阶段,G有纳什均衡及其结果,对于无限博弈,肯定存在一个贴现因子,使无限博弈的结果不劣(弱优)于G的纳什均衡结果 第三节无穷次重复博弈中的产品质量问题 假设:n家企业生产同一种产品,有优质与劣质之分,其边际成本分别为c、0,固定成本圴为F。问题: 1.企业提供优质品的条件 2.竞争性条件 3.市场出清条件 一、企业提供优质品的条件 生产劣质品的一次性得利是pq 生产优质品的无穷次性得利是 二、竞争性条件 当期利润=固定资本折旧 q(p-c)=rF 当价格p=(1+r)c时 Q=F/c 三、市场出清条件 nq=q(p) n=q(p)/q=cq(p)/F 第四节.不完全信息重复博弈与声誉 一、问题的提出 在完全信息情况下,假定静态博弈的 纳什均衡是唯一的,不论博弈重复多 少次,只要重复的次数是有限的,唯 一的子博弈精炼纳什均衡是每个参与 人在每次博弈中选择静态均衡战略。 特别地, 在有限次重复囚徒博弈中,每次都选择“坦白”是每个囚徒的最优战略。 这一结果与人们的直观感觉不一致。 阿克斯罗德( 1981)的实验结果表明,即 使在有限次重复博弈中,合作行为也频繁 出现。 二、悖论的破解:声誉模型 克瑞普斯、米尔格罗姆、罗伯茨和威尔逊(1982) 将不完全信息引入重复博弈 参与人对其他参与人支付函数或策略的不完全信息对均衡结果有重要影响, 合作行为在有限次博弈中会出现,只要博弈重复的次数足够长(没有必要是无限的)。 特别地,“坏人”可能在相当长一段时期表现得像“好人”一样。 (一)假定 囚徒1有两种类型,理性的(rational)或非理性的(irrational),概率分别为(1-p)和p。 为简单起见,假定囚徒2只有一种类型,即理性的。 理性的囚徒可以选择任何战略, 非理性的囚徒1,只有一种战略,即“针锋相对”(tit-for-tat): 开始选择“抵赖”,然后在t阶段选择囚徒2在t-1阶段的选择 即 “你抵赖我就抵赖,你坦白我就坦白”)。 “理性囚徒” 可以理解为“机会主义者” 或者非合作型参与人; “非理性囚徒” 可以理解为讲义气重信誉的人,或者合作型参与人。 说囚徒1可能是非理性的并不是说他的行为 是非理性的(即不追求效用最大化), 而是说他有一种特殊的效用函数。 (二).阶段博弈的收益矩阵 (三).博弈的顺序如下: (1)、自然首先选择囚徒1的类

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档