网站大量收购闲置独家精品文档,联系QQ:2885784924

第4动态博弈与承诺.ppt.pptVIP

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4动态博弈与承诺.ppt

第四章 动态博弈与承诺 郭四代 西南科技大学经济管理学院 一、动态博弈定义 动态博弈:各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前可以观测其他博弈方的选择、行动,甚至还包括自己的选择和行动。将这种博弈成为动态博弈或多阶段博弈。 动态博弈方如何思考策略 行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做出最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择? 如下棋 二、博弈的表述:博弈树(game tree) 阶段:动态博弈各个博弈方的选择行为有先后次序,每个博弈方的选择行为会形成一次相连的时间阶段,因此动态博弈中一个博弈方的一次选择行为可称为一个阶段。 一个动态博弈至少有两个阶段,因此动态博弈也可称为多阶段博弈。或者序列博弈,这是由动态博弈的次序特征引出来的 三、动态博弈特点 1、动态博弈的策略(战略)和结果 策略是一个完备的行动计划:是各个博弈方在整个博弈中轮到选择的每个阶段。 结果的三个含义——一是各博弈方的策略组合;二是各个博弈方策略组合形成的一条连接各个阶段的路径;最后是策略组合的最终得益。 2、动态博弈的非对称性 动态博弈中各个博弈方的选择行为有先后次序,且后行为者能观察到此前选择行为博弈方的选择行为,因此动态博弈中各博弈方的地位是不对称的。 四、可信性和纳什均衡的问题 1、 相机选择和策略中的可信性问题 2 、纳什均衡的问题 3 、逆推归纳法 1、 相机选择和策略中的可信性问题 开金矿博弈 甲在开采一价值为4万元的金矿时缺一万元资金,而乙正好有一万元可以投资。设甲想说服乙将这一万元资金借给自己开金矿,并许诺在采到金子后与乙对半分成,乙是否愿意将钱借给甲呢?其实该博弈最关心的就是甲采到金子后是都会履行诺言和自己平分。 不同版本的开金矿博弈——分钱和打官司的可信性 有法律保障的开金矿博弈 ——分钱打官司都可信 法律保障不足的开金矿博弈 ——分钱打官司都不可信 上述开金矿博弈的三个例子说明了: 各个博弈方的选择和博弈的结果,与各个博弈方在各个阶段选择各种行为的可信程度有很大的关系。 2 、纳什均衡的问题 第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。 结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。 根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题 精炼纳什均衡(perfect NE) 不包含不可信的行动的策略所组成的纳什均衡被称为“精炼纳什均衡”;也就是说,不论过去发生了什么,构成精炼纳什均衡的策略,其所规定的行动在每一个决策点上都是最优的。所以,又称为“序惯均衡”(sequential equilibrium); 首先必须是“纳什均衡”,但并非所有纳什均衡都是合理的;只有其战略不包含不可信行动的纳什均衡才是合理的。 3、 逆推归纳法 定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。 逆推归纳法是动态博弈分析最重要、基本的方法。 五、 子博弈和子博弈精炼纳什均衡 1 、子博弈 2 、子博弈精炼纳什均衡 3、均衡路径 1 、子博弈(subgame) 定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。 子博弈例子 2、子博弈精炼纳什均衡 定义:如果一个动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈精炼纳什均衡”。 精炼纳什均衡特点:(1)在原博弈是一个纳什均衡;(2)在每一个子博弈上都是纳什均衡。 子博弈精炼纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法 逆推归纳法是求子博弈精炼纳什均衡的基本方法。 在有限博弈中,我们可以用逆推归纳法求解精炼纳什均衡:从最后一个决策点开始,找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的最优决策(假定最后一个决策者的决策是最优的;如此一直到初始决策点,所有子博弈上的最优选择就是精炼纳什均衡。又称“rollback”. 举例 3、均衡路径与非均衡路径

文档评论(0)

hello118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档