- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论7. Repeated Games and Subgame-Perfect Nash Equilibrium
重复博弈与子博弈精炼纳什均衡Repeated Games and Subgame-Perfect Nash Equilibriumtrigger mechanism
张醒洲
2014-04-03
张醒洲,大连
1
2014-04-03
张醒洲,大连
2
动态博弈:要点
博弈类型
举例
解的概念
简单的完全且完美信息动态博弈
Stackelberg (1934) 双寡头垄断模型
鲁宾斯坦 (1982)
讨价还价模型
Backwards Induction Outcome (BIO)
后向归纳结果
多人两阶段重复博弈
(“同时行动” 意味着 “不完美信息”)
LazearRosen Tournaments (1981 ) 工作竞赛模型
Subgame Perfect Outcome (SPO)
子博弈精炼结果
下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈
动态博弈主题:
可信威胁与承诺会影响现在的行为
Subgame-perfect Nash equilibrium
子博弈精炼NE
动态博弈:要点
完全信息动态博弈
表述
Normal-form / Strategic-form 标准式/策略式
Extensive-form
扩展式
解的概念
Nash Equilibrium (NE)
Nash均衡
Subgame-perfect Nash equilibrium (SPNE)
子博弈精炼Nash均衡
Central Issue
中心问题
credibility threats or promise (self-enforcement)
可信性威胁或承诺
Theme
主题思想
一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不可置信的威胁和承诺。子博弈精炼纳什均衡就是通过了可信任检测的均衡。
2014-04-03
张醒洲,大连
3
重复博弈
后动者的威胁或承诺是否影响其他参与人当前的行动?
直观: 大部分直观的结论是由两阶段的例子给出的, 一些观点需要讨论无限次的情况
概念:子博弈精炼纳什均衡
重复博弈中子博弈精炼纳什均衡的概念
这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B.节分析一般完全信息动态博弈中则要复杂一些。
2014-04-03
张醒洲,大连
4
两阶段重复博弈
两阶段囚徒困境
两阶段博弈的阶段博弈有多个纳什均衡
预测第二阶段的行动
重复博弈的子博弈精炼结果
2014-04-03
张醒洲,大连
5
两阶段囚徒困境
考虑囚徒困境
给定如图2.3.1的标准式
– 纳什均衡为(L1 , L2)
– 同时行动博弈
参与人 2
参与人 1
L2
R2
L1
1, 1
5, 0
R1
0, 5
4, 4
2014-04-03
张醒洲,大连
6
让两个参与人进行两次囚徒困境博弈,第二次博弈开始之前可以观察到第一次博弈的结果,并假设整个过程博弈的总收益等于两阶段博弈收益的简单相加 (即不考虑贴现因素) 。
图2.3.1
“2 × 2 ×2博弈” 和子博弈精炼结果
两阶段囚徒困境博弈是“2×2 两人同时行动博弈” 的一个特例。利用后向归纳法的思路分析该博弈的子博弈精炼结果,参阅课本2.2.1节。
2014-04-03
张醒洲,大连
7
如果参与人1和2预测到参与人3和4在第二阶段的行动将由(a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可以用以下的同时行动博弈表示:
1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2;
2. 支付是 ui(a1,a2,a3*(a1,a2), a4*(a1,a2)),i=1,2;
假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*), a4*(a1*,a2*))为这一两阶段博弈的子博弈精炼结果。
这个子博弈精炼结果由第1阶段的唯一纳什均衡和第2阶段对它的最优反映构成.
两阶段囚徒困境
第2阶段的反应 a3*(a1,a2),a4*(a1,a2)
根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应;
注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人的反应独立于其在第一阶段的行动。
计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2. 在本例中,支付等于两个阶段博弈支付的简单和.
2014-04-03
张醒洲,大连
8
两阶段囚徒困境
第二阶段博弈的结果为纳什均衡
您可能关注的文档
最近下载
- 土地使用权及地上附着物转让协议书.docx
- 咳嗽的诊断与治疗指南.ppt
- 医养结合项目可行性研究报告.pptx
- 先进制造技术(第三版)王隆太课后习题答案解析.pdf
- Midea 美的 MK-HE1504(HE1504a)电水壶 说明书.pdf
- 2019年度一般企业财务报表模板(适用于已执行新金融准则、新收入准则和新租赁准则的企业).xlsx
- 国际经济学(第五版·数字教材版) 复习与思考习题答案汇总 第1--20章 绪论--国际经济政策协调.pdf
- 数控技术应用专业各学科课程标准.doc VIP
- 得力函数型计算器D82MS使用说明书.pdf
- 2021山西晋中生物地理考卷 (1).docx VIP
文档评论(0)