博弈论第次课——完全信息静态博弈.pptVIP

博弈论第次课——完全信息静态博弈.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论第次课——完全信息静态博弈.ppt

博弈论——完全信息静态博弈 (混合纳什均衡) 完全信息静态博弈 古诺寡头竞争博弈 古诺模型又称古诺双寡头模型(Cournot duopoly model),它是由法国经济学家古诺于1838年提出的。古诺模型是一个只有两个寡头厂商的简单模型,该模型也被称为“双头模型”。古诺模型的结论可以很容易地推广到三个或三个以上的寡头厂商的情况中去。 公共地的悲剧 经济学家很早就观察到一个现象,当资源产权没有得到明晰界定时,资源就会被过度利用。在18世纪以前,苏格兰有着广褒的草地和牧场,但到了19世纪,这些天然大牧场再也见不到了。由于草场的所有权没有界定,牧民们的过度放牧使草场失去了再生能力,牧草走向自然耗竭。 混合策略纳什均衡 上面将纳什均衡定义为一组满足所有参与人的效用最大化的策略组合。即 是一个纳什均衡,当且仅当对所有 。 根据该定义,有些博弈不存在纳什均衡。 例1:社会福利博弈(支付矩阵如下表)。 例2:猜谜游戏(猜硬币)(支付矩阵如下表)。 纯策略和混合策略纳什均衡 如果一个策略规定参与人在每一个给定的信息情况下下只选择一种特定的行动,则称该策略为纯策略。 若一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则称该策略为混合策略。在博弈的策略式表述中,混合策略可定义为在纯策略空间上的概率分布。 混合策略纳什均衡 社会福利博弈的支付矩阵 假定政府的混合策略为σG=(θ,1-θ)(即政府以θ的概率选救济,1-θ的概率选不救济),流浪汉的混合策略为σL=(r,1-r)(即流浪汉以r的概率选找工作,以1-r的概率选游荡)。则政府的效用函数为: 求其微分可得到政府最优化的一阶条件: 因此, 在混合策略均衡,流浪汉以0.2的概率选寻找工作, 0.8的概率选游荡。 问题是,解政府的最优化问题得到的却是流浪汉的混合策略。对此的可作如下解释:首先假定最优混合策略是存在的。给定流浪汉选择混合策略(r,1-r),政府选纯策略救济(即θ=1)的期望效用为: ,政府将选择救济;只有当 时,政府才会选择混合策略 或任何纯策略。 要找出政府的均衡混合策略,需求流浪汉的最优化问题。流浪汉的效用函数为: 纳什均衡要求每个参与人的混合策略是给定对方的混合策略下的最优选择。故θ*=0.5,r*=0.2是唯一的纳什均衡。即在均衡时,政府以0.5的概率选救济,0.5的概率选不救济;流浪汉以0.2的概率选找工作,以0.8的概率选游荡。 从另一方面进行说明。假定政府认为流浪汉找工作的概率严格小于0.2,则政府的唯一最优选择是纯策略不救济;但若政府以1的概率选不救济,流浪汉的最优选择是找工作,这又将导致政府选择救济,流浪汉则选游荡,……。因此,r0.2不构成纳什均衡。类似地,假定政府认为流浪汉找工作的概率严格大于0.2,则政府的唯一最优选择是纯策略救济;但若政府以1的概率选救济,流浪汉的最优选择是游荡。因此,r0.2不构成纳什均衡。容易验证, θ0.5和θ0.5也都不构成纳什均衡。 混合纳什均衡 纯策略博弈 纯策略博弈 混合策略博弈 除了纯策略Up和Down之外,A可以选择一个概率分布(pU,1-pU),即A选择Up的概率是pU,选择Down的概率是1- pU。 在这样的情况下,A选择的是介于纯策略Up和纯策略Down之间的一个混合策略(mixed strategy),表示为:(pU, 1-pU) 。 混合策略博弈 类似地,B也可以选择概率分布 (pL, 1-pL) ,即介于纯策略Left和纯策略Right之间的混合策略。 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 混合策略博弈 如果一个博弈有有限个博弈人,每个博弈人有有限的纯策略,那么这个博弈至少有一个纳什均衡。 如果这个博弈没有纯策略纳什均衡,至少有一个混合策略纳什均衡。 混合策略博弈 监督博弈来自于监督检查存在成本,因而监督者不会总是对被监督者的所有情形都实施检查,而是随机地采取检查或不检查的策略,被监督者也知道监督者的这种策略选择,因而也以随机的方式选择努力或不努力的策略。这样

文档评论(0)

love + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档