- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲混合策略纳什均衡 我们将纳什均衡定义为一组满足所有参与人的效用最大化要求的策略组合,即( s1*,…, si* , … , sn* )是一个纳什均衡,当且仅当(ui(si*, s-i *) ≥ ui(si′, s-i *)。根据这一定义,有些博弈不存在纳什均衡的。 社会福利博弈 流浪汉 找工作 游荡 救济 3,2 -1,3 政府 不救济 -1,1 0,0 这个博弈不存在纳什均衡。给定政府救济,流浪汉的最优策略是游荡;给定流浪汉游荡,政府的最优策略是不救济;给定政府不救济,流浪汉的最优策略是找工作;给定流浪汉找工作,政府的最优战略是救济;如此等等,没有一个策略组合构成纳什均衡。 猜谜游戏(A决定,B来猜;B猜中,奖励;否则,惩罚) B 正面 反面 正面 -1,1 1,-1 A 反面 1,-1 -1,1 上述两个博弈的显著特征是,每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略。这样的情况出现在诸如体育比赛和战争等情况中都会出现。在这类博弈中,都不存在纳什均衡。 上述两个博弈不存在纯策略纳什均衡,但是存在下面将要定义的混合策略纳什均衡。这里的混合策略是指参与人以一定的概率选择某种策略,比如说,参与人以0.3概率选择第一种策略,以0.2的概率选择第二种策略,以0.5的概率选择第三种策略。如果一个采取混合策略,他的对手就不能准确猜出他实际上会选择的策略,但在均衡点可以知道对手不同策略的概率分布。 流浪汉 找工作 游荡 救济 3,2 -1,3 政府 不救济 -1,1 0,0 设想政府以1/2的概率选择救济,1/2的概率选择不救济。对流浪汉来说,选择寻找工作的期望效用是1/2×2+ 1/2×1=1.5,选择游荡带来的期望效用为1/2×3+ 1/2×0=1.5。所以流浪者的任何一种策略(纯的或混合)都是对政府所选择的混合策略的最优反应。 如果流浪汉以0.2的概率选择找工作,以0.8的概率选择游荡,政府的任何一种策略(纯的或混合)都是对流浪汉所选择的混合策略的最优反应。每一个参与人的混合策略都是给定对方混合策略时的最佳选择,这一混合策略组合就是一个纳什均衡 混合策略的定义:在博弈G={s1,s2, …,sn}中,博弈方i的策略空间为Si=(si1,si2, …,sik),则博弈方以pi=(pi1,pi2, …,pik)随机选择k个可选策略称为一个混合策略。其中,0≤pik≤1,k=1,2, …,k,且pi1+pi2+…+pik=1 相对于这种以一定概率分布在一些策略中随机选择,原来的确定性的具体的策略称为纯策略,原来的纳什均衡也称为纯策略纳什均衡。纯策略也可看作特殊的混合策略。 我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是纯策略还是混合策略,只要满足各博弈方都不想单独偏离它,就称其为纳什均衡。 混合策略纳什均衡的求法,可以通过计算各方的期望得益,寻求使自己期望得益最大化的最佳反应函数,求各博弈方的最佳反应函数的公共解。可以用求最佳反应函数交点的方法,也可以用解方程组得方法。还可以应用下面的原则来计算:任何博弈方的在混合策略纳什均衡中的所选策略,都必须使其他博弈方选择其任何策略的期望得益相同。即自己的选择要使对方无机可乘,不能通过有针对性的倾向是某一策略成为优势策略。再举一个例子。 例 某博弈的得益矩阵为 乙 C D A 2,3 5,2 甲 B 3,1
文档评论(0)