第三章 重复博弈(研).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论与信息经济学 (Game Theory and Information Economics) 第4章:重复博弈 Chapter 4: Repeated Game 1 基本博弈(回顾) 囚徒困境是这样一个博弈:每个参与人有一个占优策略,但是,当所有参与人使用他们这一占优策略时,所产生的均衡对于每个人的结果,比他们都使用劣策略反而还要差。 1 基本博弈(回顾) 1 基本博弈(回顾) 1 基本博弈(回顾) 2 博弈的有限次重复 2 博弈的有限次重复 2 博弈的有限次重复 如果他们只经营3个月,则餐馆会分析且选择它们三个月中的最优策略。 2 博弈的有限次重复 2 博弈的有限次重复 2 博弈的有限次重复 3 博弈的无限次重复 3 博弈的无限次重复 3 博弈的无限次重复 思考:当某家餐馆使用TFT策略时,重复博弈如何进行? 3 博弈的无限次重复 餐馆A在第一个月背叛得到额外36,但未来会遭受损失, 所以这一得一失的相对重要性取决于现在与未来的相对 重要性。 3 博弈的无限次重复 3 博弈的无限次重复 3 博弈的无限次重复 3 博弈的无限次重复 3 博弈的无限次重复 含义:在无限次重复博弈中,如果参与人对未来足够重视 ( 足够大),那么,任何程度的合作都可以通过一个特 定的子博弈精炼纳什均衡得到。 3 博弈的无限次重复 囚徒困境博弈的可行支付集合 3 博弈的无限次重复 等待的补偿:经济学里讲的时间价值 结束的不确定性 无限次重复博弈,可以解释为有限次博弈,只是到底在那一阶段结束博弈是不确定的,每一阶段都有可能结束博弈,而且各阶段结束博弈的概率p是相等的。数学推理如下: 3 博弈的无限次重复 3 博弈的无限次重复 可以证明,当δ≥0.5时,该策略组合为SPNE。均衡结果是(购买,高质量) 重复博弈时,厂商不敢以劣货欺人 厂商有积极性考虑长远利益时,就会建立一个信誉。 为什么买于“坐贾”而非“行商”?为什么车站旁边的劣质品那么多? 企业存在的一个原因是创造一个“长期参与人”,因其考虑长期利益而遵章守纪、态度积极 3 博弈的无限次重复 亚当·斯密:最商业化的社会,也是最讲究道德的 社会。 解法Ⅱ:惩罚与奖励 施加直接惩罚于背叛的参与人:将惩罚的成本考虑 后,参与人的支付就会发生改变,囚徒困境就迎刃而 解。 解法Ⅱ:惩罚与奖励 解法Ⅲ:领导 在囚徒困境的许多例子中,博弈都假定为对称,所以参与人在背叛(合作)时,失去(得到)的支付完全相等。 然而,在实际的策略情况下,一个参与者可能相对较“大”(领导者),另一个相对较“小”。 如果支付相差较大,则背叛时,大部分的损害会如落在较大参与者身上,以致她明知对手会背叛,依然选择合作行动。 解法Ⅲ:领导 解法Ⅲ:领导 解法Ⅲ:领导 国际外交中,常常可见在囚徒困境中出现领导者的局面,领导者局面出现在大型的参与人身上,这种现象叫做“以小欺大” 较大的国家选择承担领导者的角色,为整个世界提供利益。 大的参与人在行动中更容易合作 三种解:重复Repetition惩罚和奖励Penalty and reward 领导Leadership 有一点需要强调,虽然这里说合作策略,但囚徒困境是我们在这一章解释过的非合作博弈,即每个人都独立选择和实施策略。如果两个人可以一起探讨、选择和执行他们的策略——比如,两个参与人被关在同一个房间,而且可以就是否承认犯罪一起作答——合作博弈,很容易达到想要的均衡。但是,我们现在关注的是,能够通过非合作(个人)行动去达到合作。 ?有A、B两个参与人,A借给B钱,B是否还钱 A一开始有两种选择:信任B或不信任B;B也有两种选择:守信或不守信。如果博弈只进行一次,对B而言,一旦借到钱最佳选择是不还。A当然知道B会这样做,因而A的最佳选择是不信任。结果是,A不信任B,B不守信。这个结果很糟,若双方信任本可分别得10,现在分别得0,是低效率的均衡。 所有可以让囚徒困境实现合作的机制中,最著名的就是重复博弈。所有可以让囚徒困境实现合作的机制中,最著名的就是重复博弈。前面讨论的动态博弈的这样的特征:参与人在前一个阶段的选择会决定随后的子博弈结构,所以说从后面一个决策结开始的子博弈和从前一个决策结开的子博弈完全不同(同样结构的子博弈只出现一次).——序贯博弈 。如房地产开发博弈 动态博弈的一种特殊形式:重复博弈。 过去博弈历史观察到——参与人的策略空间一下就扩大了(将自己的行动取决于对手前面的行动)——重复博弈很可能带来一些额外的均衡结果。回家的诱惑》给妻子一道多选题。劈腿的懦弱丈夫,开始一段纠结挣扎的婚外恋 ,丈夫出轨,妻子怎么办?选择一,不闻不问,装做不知道;选择二,一哭、二闹、三上吊;选择三,报复——以牙还。当然,这并不表示当你老公有了二奶时,你就要去找一位

文档评论(0)

kehan123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档