- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二节 完全信息静态博弈 四、纳什均衡Nash Equilibrium ? 女 ? 足球 芭蕾 男 足球 芭蕾 2,1 0,0 0,0 1,2 性别战 第二节 完全信息静态博弈 五、混合战略纳什均衡 (一)混合战略 纯战略pure strategies 在给定信息的情况下,一个参与人的选择是其战略空间Si中的一个战略si。 混合战略mixed strategies 在给定信息的情况下,一个参与人的选择是,以某种概率分布随机选择其战略空间中的一些或全部战略。 第二节 完全信息静态博弈 五、混合战略纳什均衡 (二)混合战略纳什均衡 混合战略(P1*,P2*)是纳什均衡的充要条件是:每一个参与人的混合战略是另一个参与人混合战略的最优反应,即V1(P1*,P2*)≥V1(P1,P2*),和V2(P1*,P2*)≥V2(P1*,P2)同时成立。(即对于参与人2的混合战略P2*,参与人1选择P1*的期望收益大于(不小于)自己选择其他战略的期望收益。这一点对于参与人2也成立。) 第二节 完全信息静态博弈 (二)混合战略纳什均衡 假定“出币人”的混合战略为δh=(θ,1-θ),即“出币人”以θ的概率选择出正面,以1-θ的概率选择出反面。“猜币人”的混合战略为δa=(γ,1-γ),即“猜币人”以γ的概率选择猜正面,以1-γ的概率选择猜反面。 “出币人”的期望效用为: Vh(δh,δa)=θ[-1·γ+1·(1-γ)]+(1-θ)[1·γ+(-1)·(1-γ)] =θ(2-4γ)+(2γ-1) 对上述效用函数求微分,得到“出币人”效用最大化的一阶条件为: =2-4γ=0;γ*=0.5 即在混合战略纳什均衡中,“猜币人”以0.5的概率猜正面,以0.5 的概率猜反面。 第二节 完全信息静态博弈 (二)混合战略纳什均衡 同样,“猜币人”的期望效用为: Va(δh,δa)=γ[1·θ+(-1)·(1-θ)]+(1-γ)[(-1)·θ+1·(1-θ)] =γ(4θ-2)+(1-2θ) 对上述效用函数求微分,得到“猜币人”效用最大化的一阶条件为: =4θ-2=0;θ*=0.5 即在混合战略纳什均衡中,“出币人”以0.5的概率出正面,以0.5 的概率出反面。 在猜谜游戏中,θ*=0.5,γ*=0.5是唯一的纳什均衡。 纳什于1950年证明,每一个有限博弈,至少存在一个纳什均衡(纯战略纳什均衡或混合战略纳什均衡)。 纳什均衡的存在性 第二节 完全信息静态博弈 第二节 完全信息静态博弈 七、完全信息动态博弈 (一)无限重复博弈 1.现值的回顾 当期限是无穷时, 第二节 完全信息静态博弈 七、完全信息动态博弈 2.触发战略 ? 企业B ? 低价 高价 企业A 低价 高价 0,0 50,-40 -40,50 10,10 一次博弈时,纳什均衡为(低价,低价)。 当无限重复博弈时,双方企业可以通过“触发战略”,实现(高价,高价)均衡。 2.触发战略 ? 企业B ? 低价 高价 企业A 低价 高价 0,0 50,-40 -40,50 10,10 触发战略trigger strategies:又称冷酷战略grim strategies,任何参与人的一次性不合作将触发永远的不合作。 企业A违背合作协议,不合作的利润现值是PVA不=50+0+0+……=50 企业A不违背合作协议,合作的利润现值是 企业A合作的条件是 2.触发战略 因此触发战略维持合作的条件是 其中,π不为参与人在一次博弈中不合作时的支付,π合为参与人在一次博弈中合作时的支付,πN为一次博弈中那什均衡的支付。即当此条件满足,用以下的触发战略在无限次博弈中总能得到合作(共谋)结果:“只要没有参与人曾经欺骗过对方,合作就继续下去。如果任何一方欺骗了另一方,另一方就永远选择一次博弈的纳什均衡战略(即不合作)惩罚对方。” 2.触发战略 上述条件的一个直观解释是: 左边表示现在不合作得到的一次性收益的增加值,右边表示由于今天的不合作使将来必须放弃的收益的现值。 第二节 完全信息静态博弈 七、完全信息动态博弈 例:无限重复博弈在产品质量上的应用 ? 企业 ? 低质量 高质量 消费者 不买 买 0,0 0,-10 -10,10 1,1 第二节 完全信息静态博弈 七、完全信息动态博弈 (一)有限重复博弈 1.子博弈精炼纳什均衡 有限重复博弈可以分为两种情况:(1)参与人不知道博弈什么时候结束;(2)参与人知道博弈什么时候结束。 第一种情况下,均衡同无限重复博弈。 第二种情况下,博弈的均衡为阶段博弈的纳什均衡重复T次,(每个阶段博弈出现的都是一次性博弈的均衡结果),即不合作会在博弈一开始就发生。 第二节 完全信息静态博弈 七、
文档评论(0)