网站大量收购闲置独家精品文档,联系QQ:2885784924

王则柯-博弈论教程(四版)8第六章 重复博弈和策略性行动(1).pptxVIP

王则柯-博弈论教程(四版)8第六章 重复博弈和策略性行动(1).pptx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 重复博弈和策略性行动(1);主要内容;6-1 囚徒困境的有限重复;囚徒困境的重复博弈中出现局中人的合作,是因为局中人担心一次不合作会招致未来合作机会的丧失。 如果未来合作的价值很大,超过采取背叛策略所能获得的短期收益,则出于对长远利益的考虑,双方会形成非契约的默契,使彼此都从默契的非契约合作中得到好处。;例子:囚徒困境的价格大战版本;一般性的分析: 假定开始的时候两家企业彼此合作,双方都实行高价。 如企业乙在某个星期一偏离这个定价策略,则它在这个星期的利润会从5万上升到6万。 甲觉得不应当继续他们之间的合作,合作瓦解。乙在往后每个星期的利润都只能是3万,而不是没有采取背叛策略之前的5万。 乙在采取背叛策略的当周获得的1万利润的增加,是以往后每个星期损失2万为代价的。即使这种合作关系的潜在持续期只有两周,采取背叛策略也不是企业乙的最优选择。;问题:如果甲乙之间的合作关系恰好持续两个星期的话,结果会是怎样呢? 倒推法:从第二个星期开始分析,最后一次博弈,不必为将来打算,各人都只追求这次博弈的利益。背叛是一个优势策略。 第一阶段即倒数第二个星期的博弈,局中人已经清楚,最后一次博弈对方肯定要实行低价,不管我现在对他如何好心(收缩产量维持高价),也不会在下一次得到好报。因此,双方都只追求当时的私利,都会采取背叛策略。 两阶段的价格大战博弈就无法走出囚徒困境。;在囚徒困境多阶段重复的博弈中,只要两个局中人的策略互动关系所持续的时间固定(重复次数是预先确定的有限数),那么在理性人假设之下,重复博弈的结果一定是每个局中人在每次博弈都采取背叛策略。 ;上述结果可以归纳为下面一般化的定理: 定理: 令G表示阶段博弈,G(T)是G重复T次的重复博弈,T<∞。如果G有唯一的纳什均衡,那么重复博弈G(T)的唯一的子博弈精炼纳什均衡的结果,是阶段博弈G的纳什均衡重复T次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。;6-2 囚徒困境的无限次重复;大多数依存策略都是触发策略( trigger strategies )。 一个局中人使用触发策略,意味着??要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。 两个最著名的触发策略: 冷酷策略(Grim strategies ) 礼尚往来策略(Tit for tat strategies) ;冷酷策略;礼尚往来策略;严格礼尚往来策略:在开始阶段博弈合作,以后则模仿对手在前一阶段博弈的行动,对手上次对我怎样,这次我就对他这么样。 严格的礼尚往来策略=不记仇的礼尚往来策略 冷酷策略=记仇的礼尚往来策略=惩罚无穷次的礼尚往来策略 ;礼尚往来实验;计算机模拟竞赛的思路: 任何参加这个竞赛的人都扮演囚徒困境中一个囚犯的角色,把自己的策略编成计算机程序; 他们的程序会被成对地融入不同的组合,分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择; 以循环赛的方式玩上150次; 游戏允许在做出合作或背叛抉择时参考对手程序前几次的选择。如果已经交手过多次,则双方就建立了各自的历史档案,用以记录对手的交往情况,通过多次交手树立了或好或差的声誉。 ;结果;第二轮游戏;“一报还一报”策略的特点;不善良:所有第一步背叛的程序都未进前10名; 不可激怒:某些程序太好脾气,被对方背叛之后不立即反应,结果鼓励某些狡猾的程序反复占他的便宜; 不宽容:某些程序对于过往关系的“好坏”太过执着,一旦被别人欺骗就很难宽容,结果使得很多本来可能恢复的合作关系永久性断绝; 不简单:某些程序把自己搞得太复杂,总是试图通过某种机巧来占人便宜,尽管与某些傻程序接触中的了高分,但一旦碰到个性“刚烈”的程序,就会搬起石头砸了自己的脚。从最后的总分来看是得不偿失。 ;艾克谢罗德在《合作进化》一书中指出,一报还一报策略能导致社会各个领域的合作,包括在最无指望的环境中的合作。演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。 假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。 只要这些个体能互相遇见,足够在今后的相逢中形成利害关系,他们就会开始形成小型的合作关系。 一旦发生了这种情况,他们就能远胜于他们周围的那些背后藏刀的类型,参与合作的人数就会增多,一报还一报式的合作最终占上风。 如果不太合作的类型想侵犯和利用他们的善意,一报还一报政策强硬的一面就会狠狠地惩罚他们,让他们无法扩散影响。 ;礼尚往来策略的缺陷;背叛一次的分析;考虑货币的时间价值;永远背叛的分析;经分析可知1 > 2/r时(r>2 ),乙会永远背叛下去

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档