- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4讲哈工大博弈论教材.ppt
* 混合策略的提出 混合策略的定义:在博弈G={N, Si, ui, i∈N}中,假设参与人i的纯策略构成的策略集合为Si={si1,…, sik},若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0≤pij ≤ 1,对于j=1 ,…, k都成立,且有, pi1+…+ pik=1 纯策略可看成特殊的混合策略 上述定义是在有限博弈前提下进行的 * 混合策略意义下的相关表述 混合策略意义下策略组合的表述 {x1∈X1, …, xn∈Xn},其中Xi , i =1, …, n表示参与人i所有纯策略生成的概率空间,xi为参与人i的一个具体混合策略 猜硬币博弈的一个混合策略就可记为{(1/2, 1/2),(1/2, 1/2)} * 混合策略 若允许每个参与人选择混合策略,则博弈结果就是一个关于纯策略组合得来一个风险结果 为研究参与人行为,需要知道各参与人对这些风险结果的偏好关系 博弈论假定每个参与人的偏好关系,可用期望收益函数表示。 * VNM效用函数 VNM效用函数理论是20世纪50年代,冯·诺依曼和摩根斯坦(Von Neumann and Morgenstern)在公理化假设的基础上,运用逻辑和数学工具,建立了不确定条件下对理性人(rational actor)选择进行分析的框架。 * VNM效用函数 如果某个随机变量X以概率Pi取值xi,i=1,2,…,n,而某人在确定地得到xi时的效用为u(xi),那么,该随机变量给他的效用便是: U(X) = P1u(x1) + P2u(x2) + ... + Pnu(xn) 表示关于随机变量X的期望效用。因此U(X)称为期望效用函数,又叫做冯·诺依曼—摩根斯坦效用函数(VNM函数)。 * 混合策略 于是可以定义基于混合策略意义下的博弈策略式表述 定义 基于(v-N-M效用的)策略式博弈由 参与人集合 每个参与人有一个(纯)策略集合 对于每一个参与人来说,由所有参与人纯策略组合构成的风险结果空间,存在一个v-N-M效用 The expected payoff of the mixed strategy Pi?is a weighted average of the expected payoffs of each of the pure strategies in the mix.? * * 混合策略意义下的纳什均衡 定义,对于博弈G= {N, Si, ui, i∈N},基于v-N-M效用的混合策略组合α*是一个纳什均衡,若对于每一个i, 以及i的任意一个混合策略αi,α*对应的期望支付至少和(αi,α*-i )的期望支付一样大 * 混合策略意义下的纳什均衡 换句话说,称混合策略组合α*是一个纳什均衡,如果没有一个参与人通过偏离策略α*i 实现支付的增加 Mixed Strategy NE A mixed strategy (P1*, P2*, … PN*), is a mixed strategy Nash Equilibrium if, for each Player i--that players mixed strategy Pi* is a best response for Player i to the strategies everyone else is picking P?-i* * * 一个定理 对于N-人静态博弈问题,设混合策略纳什均衡对应的策略组合为(Xi , X –i ) 。 对于任意的i ,若最优混合策略为Xi= {x1,…,xl,0…0}(不失一般性,假设前l个分量严格大于0),记分量xk (k=1,…, l) 对应的纯策略sk, 则对于参与人i而言,sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值,等于纳什均衡混合策略组合 (Xi, X –i )的收益值。即ui (sk, X –i ) = ui (Xi, X –i )成立 , k=1,…, l * 定理证明 由于(Xi, X –i )是纳什均衡,因此下式成立 ui (sk, X–i ) ≤ ui (Xi, X–i ), k=1,…, l 在上式中,不失一般性,假设{ui (s1, X–i ),…, ui (sl, X–i )}中,数值最小的为ui (s1, X–i ), * 一个定理 假设ui (s1, X–i ) ui (sl, X–i ) 根据 ui (Xi, X–i ) =x1ui (s1, X–i ) + x2ui (s2, X–i ) +…xlui (sl, X –i ) 可以构造一个混合策略Xi’=(0, x2,…,xl-1, (x1+xl)),满足ui (Xi’, X –
您可能关注的文档
- 第4章 节 表格和网页布局 Dreamweaver+Flash+Photoshop网页制作从入门到精通(CS6版) 课件.pptx
- 第4章 节 设置表格格式 中文版Excel 2010从入门到精通课件.pptx
- 第4章 节 课件 第四章 节 卫星轨道与分辨率 卫星海洋学 PPT.ppt
- 第4章 节 距离测量 测量学 课件.ppt
- 第4章 节 进出口货物的通关程序 报关实务课件.ppt
- 第4章 节 银行支付结算业务法律规范 金融法理论与实务.ppt
- 第4章 节 集装化与集装工具 物流学概论第三版.ppt
- 第4章 节 :生产理论 经济学概论课件.ppt
- 第4章 节 :著名汽车及商标.ppt
- 第4章 表操作 数据库技术 知识与应用教程-课件.ppt
- 2025年金肯职业技术学院单招职业适应性测试题库带答案.docx
- 2025年钦州幼儿师范高等专科学校单招综合素质考试题库完美版.docx
- 2025年钟山职业技术学院单招职业适应性考试题库参考答案.docx
- 2025年金华职业技术学院单招职业技能测试题库附答案.docx
- 2025年闽南理工学院单招职业技能测试题库审定版.docx
- 2025年闽南理工学院单招综合素质考试题库审定版.docx
- 2025年闽南理工学院单招职业倾向性考试题库汇编.docx
- 2025年闽南理工学院单招职业倾向性考试题库推荐.docx
- 2025年闽北职业技术学院单招综合素质考试题库1套.docx
- 2025年长沙轨道交通职业学院单招职业技能考试题库一套.docx
最近下载
- 工业机器人安装与调试技术PPT(高职)全套全套教学课件.pptx VIP
- 2023年青海师范大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案).docx VIP
- 青海师范大学《算法设计与分析实验》2021-2022学年期末试卷.doc VIP
- 《甲状腺的超声检查》ppt课件.ppt VIP
- 甲状腺超声检查课件.ppt VIP
- 规范甲状腺超声检查培训课件.pptx VIP
- 青海师范大学《算法设计与分析》2022-2023学年期末试卷.doc VIP
- 创新思维与能力培养课件.ppt VIP
- 规范甲状腺超声检查.PPT VIP
- 青海师范大学《算法设计与分析》2021-2022学年期末试卷.doc VIP
文档评论(0)