- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论3. Mixed strategy and Nash equilibrium
* * * * * * * * * * * * * * * * * * 2014/3/11 张醒洲,大连 * 用纯策略应对混合策略,如果列不偏执 图 1.3.2表明,一个纯策略可以是一个混合策略的最优反应,即使这一纯策略并不严格占优于其他纯策略。 在这个博弈中,B不是参与人1对参与人2的纯策略L或R的最优反应; 但是当 1/3 q 2/3时,参与人1对参与人2的混合策略 (q, 1 - q) 的最优反应是策略B。 参与人 2 L q R 1-q T 3, — 0, — 参与人 1 M 0, — 3, — B 2, — 2, — Figure 1.3.2 根据信念,选择最优混合策略应对 建立信念之关键:用好辩证法,确定支撑集 2014/3/11 张醒洲,大连 * 2014/3/11 张醒洲,大连 * 给定列的混合策略,行的最优应对 令 (r, 1- r) 为行参与人的混合策略(以概率 r 出正面,以概率1-r出背面); 给定行关于列的信念(q, 1-q), 如果列出正面, 行的期望 收益是(1-2r) ; 如果列出背面,行的期望 收益是(2r-1). 参与人2 参与人 1 正面 q 背面 1-q 正面 r -1, 1 1, -1 背面 1-r 1, -1 -1, 1 对任意 [0,1] 上的q,计算r的最优值, 用 r*(q)表示。然后,当列选择混 合策略 (q, 1 - q)时, 参与人1的最优反应是( r*, 1 - r*)。 2014/3/11 张醒洲,大连 * 对列的混合策略,行最优反应 列的策略 ,或行的信念: ( q, 1-q ); 行的策略反应 :( r, 1- r ) 求解 r* (q ) 当列的混合策略为(q, 1 - q)时,行选择 (r, 1 - r) 的期望收益如下: 参与人 2 参与人 1 正面 q 背面 1-q 正面 r -1, 1 1, -1 背面 1-r 1, -1 -1, 1 (1-2r)× q + (2r -1)×(1-q)=(2r – 1) (1- 2q) r*(q) =arg max 4(r-1/2)(1/2-q) 2014/3/11 张醒洲,大连 * 对于列的混合策略,行的最优反应 列: ( q, 1-q ) q∈[0,1] 行: ( r, 1- r ) r*(q) = arg max 4(r-1/2)(1/2-q) 图 1.3.3 当q=1/2时,行的期望收益4(r-1/2)(1/2-q)与r无关,即“行的所有混合策略 (r, 1-r) 都是无差异的”。或者说,当q=1/2 时,对于0到1之间的任何r,(r, 1-r)都是 (q, 1-q)的最优反应。 2014/3/11 张醒洲,大连 * 最优反应对应 对应是“集值函数” 这里,因为存在一个q,使得r*(q) 有不止一个值,我们称r*(q) 为参与人1的最优反应对应。是一个更一般的概念。 2014/3/11 张醒洲,大连 * 对参与人1的混合策略,参与人2的最优反应 完全信息静态博弈中,参与人同时行动, 并且参与人2和参与人1会以相同的思路考 虑此博弈。 对参与人1 的策略 (r, 1-r),参与人2的最优 反应是 (q*(r), 1-q*(r)),其中 q*(r)=arg max 4(q-1/2)(1/2-r) 2014/3/11 张醒洲,大连 * 互为最优反应对应,导致纳什均衡 最优反应r*(q)和q*(r)的交点确定了猜硬币博弈的纳什均衡: 如果参与人i的策略是 (1/2,1/2) ,则参与人j的最 优反应是 (1/2,1/2),满足纳什均衡的要求。 图 1.3.6 2014/3/11 张醒洲,大连 * 对混合策略纳什均衡的说明 在有混合策略纳什均衡的博弈中,并不需要参与人通过扔硬币、掷骰子或其他随机 化手段来选择每次的行动。 在每次玩博弈时每一个参与人确定性的选择一个纯策略.但对方不具备关于这一次选择的充分信息, 这时就要作相应的预测, 将对方的行为理解为一个混合策略,并作出相应的对策(chose a best response to a mixed strategy) 更确切地,我们可以把参与人j 的混合策略解释为参与人i对参与人j选择哪一个纯策略的不确定性。我们可以用“信念”来表示对这种不确
您可能关注的文档
最近下载
- DB41T 2431-2023 重点区域地质灾害风险调查评价规范(1:10000).docx VIP
- 2012 INTERNATIONAL BUILDING CODE (2012年国际建筑规范).pdf VIP
- 金龙湖养老度假基地可行性报告.doc VIP
- 光伏发电工程施工规范.docx VIP
- 渗透检测工艺规程.pptx VIP
- 质量员考试(市政质量)基础知识试卷真题(2025年新版附解析).docx VIP
- 幼儿园课件:变焦PPT.ppt
- KEF音响无线HiFi扬声器LS50 Wireless II用户手册.pdf VIP
- 一种低气味、低刺激双固化胶粘剂及其制备方法.pdf VIP
- 设计机构设置和岗位职责.docx VIP
文档评论(0)