- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论4[精选]
3.2 混合策略及纳什均衡 混合策略的定义:在博弈G={s1,s2, …,sn}中,博弈方i的策略空间为Si=(si1,si2, …,sik),则博弈方以pi=(pi1,pi2, …,pik)随机选择k个可选策略称为一个混合策略。其中,0≤pik≤1,k=1,2, …,k,且pi1+pi2+…+pik=1 相对于这种以一定概率分布在一些策略中随机选择,原来的确定性的具体的策略称为纯策略,原来的纳什均衡也称为纯策略纳什均衡。纯策略也可看作特殊的混合策略。 我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是纯策略还是混合策略,只要满足各博弈方都不想单独偏离它,就称其为纳什均衡。 混合策略纳什均衡的求法,可以通过计算各方的期望得益,寻求使自己期望得益最大化的最佳反应函数,求各博弈方的最佳反应函数的公共解。可以用求最佳反应函数交点的方法,也可以用解方程组的方法。还可以应用下面的原则来计算:任何博弈方的在混合策略纳什均衡中的所选策略,都必须使其他博弈方选择其任何策略的期望得益相同。即自己的选择要使对方无机可乘,不能通过有针对性的倾向使某一策略成为优势策略。举一个例子说明: 例 某博弈的得益矩阵为 乙 C D A 甲 B 这个博弈没有纯策略纳什均衡。要计算混合策略纳什均衡,设甲的混合策略为(p,1-p), 则甲的选择必须使乙选C和选D的期望得益相等,即:p×3+(1-p) ×1=p×2+(1-p) ×5 解得p=0.8。即甲的混合策略是(0.8,0.2) 同样,设乙的混合策略为(q,1-q) ,则乙的纳什均衡策略也必须使甲无论选A还是选B的期望收益相等。即: q×2+(1-q) ×5=q×3+(1-q) ×1 解得 q=0.8 即乙的混合策略也是(0.8,0.2) 容易算出在这个混合策略纳什均衡下,甲乙各自的得益都是2.6.它的意义是说,虽然在一次博弈中,其结果只能是得益矩阵中四个得益的一种,但多次独立重复进行,平均结果是双方各得2.6. 再看几个例子。 1.制式问题 彩电有不同的制式,采用相同的制式,则不同厂商间的零部件可以通用,相关设备可以相互匹配,对大家有一定的好处,但也有互相竞争的压力和损失。设两个厂商要引进生产线,面临A、B 两个制式,其得益矩阵如下: 厂商2 A B A 厂商1 B 容易看出,该博弈有两个纯策略纳什均衡: (A,A)和(B,B),但会出现哪一个均衡呢?可以看出,厂商1喜欢后一个而厂商2 喜欢前一个均衡。没有必然的结果,因此,双方的决策要进行混合策略决策。 不难算出厂商1的纳什均衡混合策略是(0.4,0.6) 厂商2的混合策略纳什均衡策略是(0.67,0.33) 在此均衡下,双方的期望得益分别为0.664 和1.926,都小于任何一个纯策略纳什均衡的得益。 由此可见,政府或行业组织制定统一的标准或规定是非常重要的。这也是世界上各国甚至国际间对许多重要产品规定统一规格、标准的原因。 当然因为技术垄断等因素,也有相反的、各厂商间不统一的例证:如打印机墨盒、手机充电器等。 2.市场机会 设两个厂商都发现了一个市场机会,但市场容量不大。若只有一家进入,能赚100,若同时进入,则各亏50. 厂商2 进 不进 进 厂商1 不进 本博弈也有两个纯策略纳什均衡(不进,进),(进,不进)但它们分别有利于两个厂商,因此这两个均衡都不容易实现,都应采取混合策略。 请同学们自己计算混合策略纳什均衡及得益。 4.小偷与保安 2006年杭州市一网民建立了网上防小偷地图,人们质疑为什么没有警方版的防小偷地图? 我们假定一个小偷要去偷一个仓库,若保安没有睡觉,就会抓住小偷,小偷将有-P的负效用;若保安睡觉,则小偷就会成功,将会得到V的赃物。 若小偷不去偷,保安睡觉则有S的正效用,睡觉被解雇得益为-D。假定单位都相同。
您可能关注的文档
最近下载
- 鑫达能锂电池充放电测试设备 BCDS70-05-10规格书.docx VIP
- 【新教材】2025-2026学年人教版(2024)七年级上册数学教学计划及进度表.pdf VIP
- 英飞克G3系列用户手册 V3.0.pdf VIP
- 最新工资提成方案.pdf VIP
- 人教鄂教版一年级上册科学第一单元第2课《不倒翁》教学课件(2024新教材).pptx
- 第7课 基督教的兴起和法兰克王国(核心素养精品课件).pptx VIP
- 外感咳嗽护理查房ppt.pptx
- DLT-5161-2018电气装置安装工程质量检验及评定规程.doc VIP
- 富氧熔炼底吹炉渣含铜的控制.pdf VIP
- 小学四年级健康教育课件.pptx VIP
文档评论(0)