网站大量收购闲置独家精品文档,联系QQ:2885784924

王则柯-博弈论教程(四版)5第三章 混合决策纳什均衡(2).pptxVIP

王则柯-博弈论教程(四版)5第三章 混合决策纳什均衡(2).pptx

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 混合策略纳什均衡(2); 3-3 多重纳什均衡及其筛选 帕累托优势标准 风险优势标准 聚点均衡 相关均衡 抗共谋均衡 颤抖手精炼均衡 ;3-3 多重纳什均衡及其甄别;1.帕累托优势标准;例子:猎人博弈;猎人博弈;2.风险优势标准;(1)期望赢利比较法;(2)偏离损失比较法;帕累托标准与风险优势的关系;帕累托优势标准: A 风险优势: 期望赢利比较法: B 损失偏离比较法: B 很多人会选择B。 理由一:人是会犯错误的; 理由二:人不喜欢冒大的风险(风险厌恶)。;判断;3.聚点均衡;例如:情侣博弈 如果今天是男的生日, (足球,足球)可能是一个聚点均衡;而如果是女的生日,(芭蕾,芭蕾)可能是一个聚点均衡。这里,出现聚点均衡背后的原因是,在女的生日时,男的可能认为应该讨女的欢心,而女的也认为男的会认为应该讨自己欢心,结果,他们都出现在芭蕾舞厅。 例如:靠右或靠左行驶是聚点均衡。具体靠哪边,要看习俗和默契。 例如:通话过程中线路断了,怎么办? ;路上有两辆车迎面而行,此时,两个司机各有两个选择:走路的左侧和走路的右侧。 如果在中国,出现(R,R),如果在英国,出现(L,L)。; 聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,但因为它所涉及的方面众多,往往受博弈双方文化背景中的习惯或规范的影响,很难总结出具有普遍性的规律,只能具体问题具体分析地讨论。;4.相关均衡; “甲先到,走甲上乙左均衡;乙先到,走甲下乙右均衡”,且双方都认为对方先到达的概率相等。那么,每个人的期望支付为3,优于双方各自来用混合策略时所得到的期望支付2.5。;相关机制: 各1/3概率发信号A、B、C 甲能看到是否A,乙能看到是否C “甲见A采用上,否则下;乙见C采用右,否则左”是一个纳什均衡。;当甲收到信号 A 时,他知道乙收到了信号 (A,B),因而乙将采用策略 “左”,在这种情况下,策略 “上”显然是甲的最优策略;如果甲观察到信号 (B,C),即非 A,则他将预期乙会以相同的概率采用策略 “左”或策略 “右”,此时无论甲选择策略 “上”还是策略 “下”,所得到的平均支付都是2.5,因此他会愿意采用策略 “??”。局中人乙的情况可按照类似的思路验证。所以,上述 “相关规则”构成一个纳什均衡。 因为按照上述规则, (上,左)、 (下,右)和 (下,左)这三种结果各以1/3的概率出现,而 “坏”结果 (上,右)则不会出现,所以每个局中人的期望支付都是;5.抗共谋均衡; 博弈的纯策略纳什均衡:(U,L,A)、(D,R,B) 前者帕累托优于后者。 (U,L,A)有共谋 (coalition)问题:博弈方甲和乙同时偏离。;纳什均衡的精髓,是单独偏离没有好处。但是在纳什均衡要求的单独偏离没有好处的情况下,仍然可能存在若干局中人集体偏离或者说共谋偏离的激励。如果一个纳什均衡存在若干局中人集体偏离的激励,它是博弈的一个不稳定的结果。;抗共谋均衡;纯策略纳什均衡( U,L,A )不是抗共谋纳什均衡。 试分析(D,R,B)是抗共谋纳什均衡。;结果;强均衡;例子: 考虑如下一个三人博弈:参与人分别为甲、乙、丙,每个参与人都有两个纯策略可供选择:甲可选择 A 或者 B;乙可选择 C 或者 D;丙可以选择 E 或者F。;6.颤抖的手精炼均衡;纳什均衡(D,R)只要B有犯错误的可能,D就不是局中人A的最优选择。同样,只要A有犯错误的可能,R就不是局中人B的最优选择。 (U,L)却是一个颤抖手均衡:无论局中人A犯错误的概率有多大,只要犯错误的概率小于1,局中人B都没有激励要选择R;同样地,无论B犯错误的概率有多大,只要小于1,局中人A都没有激励选择D。;颤抖的手精炼均衡的定义; 定义中的 必须是严格混合策略,即选择每一个纯策略的概率都严格为正。 条件 (1)意味着,尽管每一个局中人i都有可能犯错误,但错误收敛于0。 条件 (2)意味着,每一个局中人所选择的策略pi,不仅在其他人不犯错误时是最优的 (即符合纳什均衡的条件),而且在其他人错误地选择了 时也是最优的。 ;例子: 考虑每个局中人各有三种纯策略可供选择的如下二人策略型博弈,A 有上中下三个策略,B有左中右三个策略。各种策略对阵的得益如图数字所示。;局中人 A 的期望支付是: EUA =q[4(m-2)+3+2]/m+r[0(m-2)+2+1]/m + (1-q-r)[3(m-2)+1+2]/m = {q[4m-8+3+2]+3r+ (1-q-r)[3m-6+1+2]}/m = {q[4m-3]+3r+ (1-q-r)[3m-

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档