- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论(第四讲)理性是共同知识时的博弈求解PPT
理性是共同知识时的博弈求解
Yang Ling
基本概念:理性、信念、混合策略与期望效用
博弈求解:参与者是理性的
博弈求解:参与者是理性的且参与者知道
参与者是理性的
博弈求解:理性成为共同知识
定位博弈
合伙人博弈
第4讲 理性是共同知识时的博弈求解
4.1 基本概念
4.1.1基本概念——理性
当一位参与者尽可能使自己的支付最大化并采取行动时, 就认为这位参与者是理性的。
参与者有足够的能力对自身的处境进行判断
参与者有足够的能力对其他参与者的行为进行预期
参与者有足够的能力对各种行动方案进行评估
参与者以自身支付最大化原则采取行动
理性意味着仅仅追求自身的利益,而不管这些利益是如何 被定义的。
偏好
4.1 基本概念
4.1.2基本概念——信念
信念是参与人对其他参与人行为的主观判断。从数学上看,参与人i的信念是关于其他参与人的策略的一个概率分布,用μ-i来表示, μ-i ∈ΔS-i,其中ΔS-i是指除了参与人i的其他所有参与人所采取策略的概率分布集合。
在两方博弈中(-i=j),假定每个参与人都有有限数量的策略。参与人i对于参与人j所采取策略的信念是一个函数μj∈ΔSj,其中对于参与人j的每一个策略sj∈Sj, μj ( sj )表示参与人i认为参与人j可能采取sj的概率。
μj性质:对于每一个sj∈Sj , 有 μj ( sj ) ≥0且 Σsj∈Sj μj ( sj ) =1
比如,参与人j的策略有A,B,C三种, μj ( A )=1/3, μj ( B)=1/6 , μj ( C )=1/2。
4.1 基本概念
4.1.3基本概念——混合策略
一个参与人的混合策略是指这个参与人根据一个概率分布来随机选择策略的行为。参与人i的混合策略用σi表示, σi ∈ ΔSi, ΔSi为参与人i的混合策略集合。
比如,一个参与人可以在U和D两种策略之间进行选择,他选择U的概率为1/2,选择D的概率也为1/2,则他的混合策略为(1/2,1/2)。
σi 性质: σi中的每个元素不小于0,各元素之和为1.
混合策略包括了纯策略,纯策略是混合策略的一种特殊情况。
4.1 基本概念
基本概念——最优反应(上)
假设参与人i对于其他参与人采取的策略具有信念,μ-i ∈ΔS-i,参与人i的策略si ∈ Si如果对于任何s’i ∈ Si都满足ui(si,μi)≥ ui(s’i,μi),那么si是一个最优反应。
以右图所示的博弈为例,假设参与人1相信参与人2采取策略L的可能性为1/3,采取策略C的可能性为1/2,采取策略R的可能性为1/6.这个信念可表示为(1/3,1/2,1/6)。
参与人1采取策略U、M、D的期望效用分别为:
4.1 基本概念
基本概念——最优反应(下)
仍以右图所示的博弈为例,假设参与人2对参与人1所采取的策略具有信念(1/2,1/4,1/4)。
参与人2采取策略L、C、R的期望效用分别为:
【要点说明】
1. 最优反应是一个集合,其元素不一定只有一个。
2. 根据对其他人策略的信念相应采取最优反应策略本身并不是一种策略行为,可看作理性动物的一种本能。
3. 采取行动的最关键部分在于信念中所包含的信息。获得博弈的成功常常取决于你对于对手的了解是否超过对手对你的了解。
4.2 博弈求解:参与者是理性的
严格优于(strictly dominates):无论其他对手的策略是什么,若策略s产生的支付(收益)严格高于s’产生的收益,那么策略s为严格优于策略s’。
4.2 博弈求解:参与者是理性的
弱优于(weakly dominates):无论其他对手的策略是什么,若策略s产生的支付(收益)不低于s’产生的收益,那么策略s为弱优于策略s’。
4.2.2 博弈求解:参与者是理性的 ——弱优于
4.2 博弈求解:参与者是理性的
4.2.2 博弈求解:参与者是理性的 ——占有策略
歌剧《托斯卡》的博弈情景反映了个人理性与集体理性之间的重要区别。
占优策略(dominant strategy):如果一个策略严格优于其他策略,那么称这个策略为占优策略。
如果一个策略被占优,则称为劣势策略。
一个理性参与者从不使用严格劣势策略,
一个理性参与者总是使用占优策略。
4.2 博弈求解:参与者是理性的
4.2.4博弈求解:参与者是理性的——小练习
找出以下博弈中的劣势策略:
要点提示:
在一个策略未被纯策略占优时,要考虑这个策略是否被混合策略占
您可能关注的文档
最近下载
- 数码摄像机-松下-AJ-D965MC说明书.pdf VIP
- 2024年巡察整改专题民主生活会个人“聚焦四个方面”对照检查材料范文2篇.docx VIP
- 人工智能对文化产业的推动.pptx VIP
- 人教版(2024)七年级上册英语教学计划(含教学进度表).docx
- 软件的项目可行性的研究的报告编写.ppt VIP
- 一种用于处理高硫高砷金矿的提金剂及其制备方法.pdf VIP
- 中国甲状腺疾病诊治指南ppt.pptx VIP
- 《中国抗癌协会甲状腺癌整合诊治指南(2022精简版)》解读PPT课件.pptx VIP
- 一种澳洲坚果种质热敏感等级的精准诊断及其缓解新梢叶片热伤害的方法.pdf VIP
- 全球常见传染病防控概述.pptx VIP
文档评论(0)