博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium.pptx

博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium.pptx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium

重复博弈与子博弈精炼纳什均衡 Repeated Games and Subgame-Perfect Nash Equilibrium trigger mechanism 张醒洲 2014-04-03 张醒洲,大连 1 2014-04-03 张醒洲,大连 2 动态博弈:要点 博弈类型 举例 解的概念 简单的完全且完美信息动态博弈 Stackelberg (1934) 双寡头垄断模型 鲁宾斯坦 (1982) 讨价还价模型 Backwards Induction Outcome (BIO) 后向归纳结果 多人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈精炼结果 下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈 动态博弈主题: 可信威胁与承诺会影响现在的行为 Subgame-perfect Nash equilibrium 子博弈精炼NE 动态博弈:要点 完全信息动态博弈 表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式 解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈精炼Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想 一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不可置信的威胁和承诺。子博弈精炼纳什均衡就是通过了可信任检测的均衡。 2014-04-03 张醒洲,大连 3 重复博弈 后动者的威胁或承诺是否影响其他参与人当前的行动? 直观: 大部分直观的结论是由两阶段的例子给出的, 一些观点需要讨论无限次的情况 概念:子博弈精炼纳什均衡 重复博弈中子博弈精炼纳什均衡的概念 这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B.节分析一般完全信息动态博弈中则要复杂一些。 2014-04-03 张醒洲,大连 4 两阶段重复博弈 两阶段囚徒困境 两阶段博弈的阶段博弈有多个纳什均衡 预测第二阶段的行动 重复博弈的子博弈精炼结果 2014-04-03 张醒洲,大连 5 两阶段囚徒困境 考虑囚徒困境 给定如图2.3.1的标准式 – 纳什均衡为(L1 , L2) – 同时行动博弈 参与人 2 参与人 1 L2 R2 L1 1, 1 5, 0 R1 0, 5 4, 4 2014-04-03 张醒洲,大连 6 让两个参与人进行两次囚徒困境博弈,第二次博弈开始之前可以观察到第一次博弈的结果,并假设整个过程博弈的总收益等于两阶段博弈收益的简单相加 (即不考虑贴现因素) 。 图2.3.1 “2 × 2 ×2博弈” 和子博弈精炼结果 两阶段囚徒困境博弈是“2×2 两人同时行动博弈” 的一个特例。利用后向归纳法的思路分析该博弈的子博弈精炼结果,参阅课本2.2.1节。 2014-04-03 张醒洲,大连 7 如果参与人1和2预测到参与人3和4在第二阶段的行动将由(a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可以用以下的同时行动博弈表示: 1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2; 2. 支付是 ui(a1,a2,a3*(a1,a2), a4*(a1,a2)),i=1,2; 假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*), a4*(a1*,a2*))为这一两阶段博弈的子博弈精炼结果。 这个子博弈精炼结果由第1阶段的唯一纳什均衡和第2阶段对它的最优反映构成. 两阶段囚徒困境 第2阶段的反应 a3*(a1,a2),a4*(a1,a2) 根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应; 注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人的反应独立于其在第一阶段的行动。 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2. 在本例中,支付等于两个阶段博弈支付的简单和. 2014-04-03 张醒洲,大连 8 两阶段囚徒困境 第二阶段博弈的结果为纳什均衡

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档