博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium.pptx

下载文档 降价啦

74
0
约6.49千字
约 20页
2017-06-23 发布于湖北
举报
版权申诉
保障服务

博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium.pptx

1、本文档共20页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium

重复博弈与子博弈精炼纳什均衡Repeated Games and Subgame-Perfect Nash Equilibriumtrigger mechanism 张醒洲 2014-04-03 张醒洲，大连 1 2014-04-03 张醒洲，大连 2 动态博弈：要点博弈类型举例解的概念简单的完全且完美信息动态博弈 Stackelberg (1934) 双寡头垄断模型鲁宾斯坦 (1982) 讨价还价模型 Backwards Induction Outcome (BIO) 后向归纳结果多人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈精炼结果下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈动态博弈主题: 可信威胁与承诺会影响现在的行为 Subgame-perfect Nash equilibrium 子博弈精炼NE 动态博弈：要点完全信息动态博弈表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈精炼Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想一个完全信息动态博弈可能会有很多个纳什均衡，但是有些均衡包含了不可置信的威胁和承诺。子博弈精炼纳什均衡就是通过了可信任检测的均衡。 2014-04-03 张醒洲，大连 3 重复博弈后动者的威胁或承诺是否影响其他参与人当前的行动？直观: 大部分直观的结论是由两阶段的例子给出的, 一些观点需要讨论无限次的情况概念：子博弈精炼纳什均衡重复博弈中子博弈精炼纳什均衡的概念这一定义在重复博弈的条件下表述比较容易理解，而在2.4.B.节分析一般完全信息动态博弈中则要复杂一些。 2014-04-03 张醒洲，大连 4 两阶段重复博弈两阶段囚徒困境两阶段博弈的阶段博弈有多个纳什均衡预测第二阶段的行动重复博弈的子博弈精炼结果 2014-04-03 张醒洲，大连 5 两阶段囚徒困境考虑囚徒困境给定如图2.3.1的标准式 – 纳什均衡为(L1 , L2) – 同时行动博弈参与人 2 参与人 1 L2 R2 L1 1, 1 5, 0 R1 0, 5 4, 4 2014-04-03 张醒洲，大连 6 让两个参与人进行两次囚徒困境博弈，第二次博弈开始之前可以观察到第一次博弈的结果，并假设整个过程博弈的总收益等于两阶段博弈收益的简单相加 (即不考虑贴现因素) 。图2.3.1 “2 × 2 ×2博弈” 和子博弈精炼结果两阶段囚徒困境博弈是“2×2 两人同时行动博弈” 的一个特例。利用后向归纳法的思路分析该博弈的子博弈精炼结果,参阅课本2.2.1节。 2014-04-03 张醒洲，大连 7 如果参与人1和2预测到参与人3和4在第二阶段的行动将由(a3*(a1,a2)，a4*(a1,a2))给出，则参与人1和2在第一阶段的问题就可以用以下的同时行动博弈表示： 1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2； 2. 支付是 ui(a1,a2,a3*(a1,a2), a4*(a1,a2))，i=1,2；假定（a1*,a2*）为以上同时行动博弈唯一的纳什均衡，我们称 (a1*,a2*,a3*(a1*,a2*), a4*(a1*,a2*))为这一两阶段博弈的子博弈精炼结果。这个子博弈精炼结果由第1阶段的唯一纳什均衡和第2阶段对它的最优反映构成. 两阶段囚徒困境第2阶段的反应 a3*(a1,a2)，a4*(a1,a2) 根据第一阶段的行动a1和 a2 ，预测第二阶段参与人的反应；注意，在囚徒困境博弈中存在唯一的纳什均衡，因此参与人的反应独立于其在第一阶段的行动。计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2))，i=1,2. 在本例中，支付等于两个阶段博弈支付的简单和. 2014-04-03 张醒洲，大连 8 两阶段囚徒困境第二阶段博弈的结果为纳什均衡