- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 不完全信息动态博弈
第一节 完美贝叶斯均衡
引入 “完美贝叶斯均衡 ”的目的是进一步 “精炼 ”贝叶斯纳什均衡。 就像子博弈完美的条件
是为了 “精炼 ”动态博弈中的纳什均衡一样,其是为了剔除不可置信的威胁(或者承诺) 。
子博弈完美不仅要求参与者的策略组合是一个纳什均衡, 而且要求其在每一个子博弈中
都是纳什均衡。 和子博弈完美纳什均衡类似, 当不完全信息博弈由静态发展到动态之后, 我
们也面临对原有 “均衡 ”概念进一步精炼的要求。
当然,本章中,我们不是考虑 “子博弈 ”,而是考虑更加广义的 “后续博弈( continuation
game)”,和子博弈相比,它可以不是始于单节的信息集。
(请联系后面 “完美贝叶斯均衡 ”“序贯均衡 ”的定义,思考:不同的 “均衡 ”定义是如何以何种方式考虑到前面提到的 “后续博弈 ”的)
和上一章一样,本章中的博弈存在 “不完全信息 ”,这涉及到参与者行动时所依据的 “信念”。因此,对均衡解的 “精炼 ”,就必须设计对 “信念 ”的考察。而我们对不完全信息的处理,仍然沿用上章的 “海塞尼转换 ”,假设有个 0 博弈方 “自然 ”,决定各参与人的类型但是只将类型告诉本人。于是, “不完全信息 ”可以转变为 “不完美信息 ”。
当然,处理 “不完全信息动态 ”博弈中 “均衡 ”的 “精炼 ”问题时, 子博弈完美并不能 “胜任 ”。
但是,既然 “不完全信息 ”可以通过 “海塞尼转换 ”转变为 “不完美信息 ”,则对 “不完全信息 ”的
精炼方法,同样适用于 “不完美信息动态博弈 ”。
(回忆前面的 “完全但不完美信息动态博弈 ”,为什么没用考虑到进一步的 “精炼 ”,或者
说本章将要进行的对 “信念 ”的精炼?因为前面的信息 “不完美 ”是由于 “同时选择 ”造成的,而
且我们假定其 “同时选择的子博弈 ”中有唯一的纳什均衡,
因此,不需要对信念进行进一步的
精炼 )
首先,我们通过以下例子来说明进一步
“精炼 ”的必要性:
1
R
(1, 3)
L
M
2
L’
R’
L’
R’
(2, 1)
(0, 0)
(0, 2)
(0, 1)
L’
R’
L
2, 1
0, 0
M
0, 2
0, 1
R
1, 3
1, 3
1
此博弈有两个 NE :( L,L ’)和( R,R’),而且本博弈没有子博弈,因此,子博弈完美的
要求自然满足。然而, ( R,R’)却依赖一个明显不可信的威胁。
为了 “精炼 ”掉这样的 NE ,我们提出以下要求:
要求 1:在每一个信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪一个
节点有一个推断(信念
belief )。
要求 2:给定参与者的推断,参与者的策略必须满足序贯理性(
sequentially rational )的
要求。
比如上例中:
1
R
(1, 3)
L
M
2
1-p
p
L’
R’
L’
R’
(2, 1) (0, 0) (0, 2) (0, 1)
给定推断( p, 1-p), L’的期望得益 =p1+(1-p)2=2- pR’的期望得益 =1-p 。因此,就排除了( R,R’)。
这是一种特殊情况,那么,参与者的信念是否有都是 “理性 ”的呢?
定义:对于一个给定的扩展式博弈中给定的均衡, 如果博弈根据均衡策略进行时, 将以正的概率到达的信息集, 我们称是处于均衡路径上的; 反之, 则称为是非均衡路径上的信息集。
要求 3:在处于均衡路径上得信息集中,推断由贝叶斯法则及参与者的均衡策略给出。
(信念要与策略相容)
以上三个要求包含了完美贝叶斯均衡的主要内容,
Wilson and Kreps( 1982)将推断(信
念)提到了和策略同等重要的位置。
在这里, 一个均衡不再只是一个策略组合,还包括每一
个行动集的推断。
In dynamic Bayesian games, an assessment consists of a strategy profile
σ and a system o
beliefμ .
The belief
i
ofμplayer i is strategically consistent with the strategy profile
σ , if it is deri
from the Bayesian rule when it
’ s along the equilibrium path.
The strategy
i
ofσplayer i is sequentially rational if given
i
and all other playersμ
i
σ
’ strategy,
maximizes i ’ s (expected) payoff start
您可能关注的文档
最近下载
- 2026版高考物理专题提升练习-动量守恒在子弹打木块模型和滑块.docx VIP
- SICK西克KTS&KTX Prime色标传感器操作手册.pdf VIP
- 10.1《 劝学》课件(共36张PPT) 2024-2025学年统编版高中语文必修上册.pptx VIP
- 梅州围龙屋一种富有特色的典型客家围村建筑.pptx VIP
- SICK西克KTS&KTX Prime操作手册.pdf VIP
- [2025秋期版]国开电大专科《人力资源管理》一平台形考任务一至四在线形考试题及答案 (2).pdf
- 模型1弹簧模型-动量守恒的九种模型解读.docx VIP
- 二年级数学上册北师版25秋《小学学霸A卷》.pdf VIP
- 内科护理学之肾小球肾炎.ppt VIP
- (126页PPT)IBM胜任力模型建设指南.pptx
文档评论(0)