混合的策略纳什均衡.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
混合的策略纳什均衡

清华诚志 混合策略纳什均衡 Mixed Strategy Nash Equilibrium 理学院 顾聪 gucong@yeah.net 2. 混合策略、混合策略博弈和混合策略纳什均衡 策略: 参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。 纯策略: 如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯策略,简称“策略” ,即参与人在其策略空间中选取唯一确定的策略。 混合策略: 如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合策略。参与人采取的不是明确唯一的策略,而是其策略空间上的一种概率分布。 混合策略 vs.纯策略 (不确定性 vs.确定性) 在博弈 中,博弈方 的策略空间 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 纯策略可以理解为混合策略的特例,即在诸多策略中,选择该纯策略的概率为1,选其他纯策略的概率为0. 为何参与人可能会选择带不确定性的混合策略而放弃确定性的纯策略? 参与人主观因素造成的犹豫不决 外在客观因素的不确定性带来应对策略的不确定性 迷惑对手:为了让其它参与人不能清楚了解自己的选择 由于混合策略伴随的是支付的不确定性,因此参与人关心的是其期望效用。 最优混合策略:是指在给定对方的混合策略的情况下,使期望效用函数最大的混合策略。 在两人博弈里,混合策略纳什均衡是两个参与人的最优混合策略的组合。 在讨论连续纯策略均衡时(如古诺模型),我们使用了反应函数的概念。 现在我们可以使用反应对应的概念来描述一个参与人对应于其他参与人混合策略的最优选择。 两个概念的区别仅仅在于: 反应函数表示的是一个参与人只有一个特定的策略是其他人给定策略的最优选择; 反应对应允许一个参与人有多个(甚至无穷多个)策略是其他人给定策略的最优选择。 混合策略反应函数 猜硬币博弈 夫妻之争博弈 尽管纳什均衡非常重要,但不是说学到了这种分析方法你就能预测所有博弈的结果。纳什均衡分析仅仅保证有个体理性的智能人的博弈结果是唯一纯策略纳什均衡时的预测。实际情况是纳什均衡分析并不能保证对所有博弈的结果都作出准确的预测。 现实中的博弈可能是下面三种情况之一: 1、有许多博弈不存在纯策略纳什均衡; 2、有些博弈是多重纳什均衡; 3、博弈方可能是集体理性或有限理性。 此时纳什均衡分析就不是绝对有效的。对这些问题有不同程度的解决,例如,实验经济学和行为经济学的成果为寻找有限理性时的博弈均衡提供了支持。一些新的均衡概念,例如,帕累托上策均衡、风险上策均衡、聚点均衡和相关均衡等为多重纳什均衡时的决策找到了方向。 即:每一个有限博弈至少存在一个纳什均衡。 1. 纳什定理(Nash,1950): 在一个有n个博弈方的博弈 中, 如果n是有限的,且Si 都是有限集,则该博弈至少存在一个纳什均衡(纯策略的或混合策略的)。 现实中的博弈都是可以当作有限博弈来解决。这样纳什均衡的存在就是普遍的。纳什均衡的普遍存在性是纳什均衡概念最重要的性质。 4.3 纳什均衡的存在性定理 2. 纳什定理的推广 纳什均衡的存在性定理2: 当博弈方个数有限,战略集是非空、闭的、有界的,支付函数是连续且拟凹的,则博弈至少存在一个纯战略纳什均衡。 (Debreu,1952; Clicksberg,1952; Fan,1952) 纳什均衡的存在性定理3: 当博弈方有限,战略集是非空、闭的、有界的,支付函数是连续的,则博弈至少存在一个纳什均衡(纯战略的或混合战略的)。 (Clicksberg, 1952) 3. 纳什均衡应用的局限性 不同均衡概念的关系 占优均衡 DSE 重复剔除占优均衡 IEDE 纯策略纳什均衡 PNE 混合策略纳什均衡 MNE * * 清华诚志 两个参与人各拿一枚硬币,并选择出正面向上还是反面向上。若两枚硬币是一致的(即全部正面或全部反面),则参与人2赢走参与人1的硬币;若两枚硬币不一致(一正一反),参与人1赢得参与人2的硬币。支付矩阵如下: 参与人1 参与人2 -1, 1 1,-1 1,-1 -1, 1 正面 反面 正面 反面 由划线法可知,该博弈不存

文档评论(0)

bokegood + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档