- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4讲哈工大博弈论课件
* 同理,可绘出丈夫的反应函数,见图1-18 r q 0 1/3 1 图1-17 妻子的反应函数 1 r=R1(q) r q 0 1/3 1 图1-18 丈夫的反应函数 1 q=R2(r) 3/4 2×2双矩阵博弈的图解法 * r q 0 1/3 1 图1-17 妻子的反应函数 1 r q 0 1/3 1 图1-18 丈夫的反应函数 1 r=R1(q) q=R2(r) 3/4 2×2双矩阵博弈的图解法 将这两张图合并,得到图1-19 * r q 0 1/3 1 图1-19 性别战的图解法 1 q r=R1(q) q=R2(r) 3/4 按照纳什均衡的定义,图上的三个交点既是参与人1的最优反应函数上的点,同时也是参与人2最优反应函数上的点 2×2双矩阵博弈的图解法 * r q 0 1/3 1 图1-19 性别战的图解法 1 q r=R1(q) q=R2(r) 3/4 这三个点的坐标为(0, 0), (1/3, 3/4),(1, 1)。对应的三个策略分别是:(足球,足球);妻子、丈夫分别以1/3、3/4的概率选择时装;(时装,时装)。 2×2双矩阵博弈的图解法 * * * 纳什均衡求解:图解法(练习) B A 左 右 上 3,2 -1,3 下 -1,1 0,0 参 与 人 2 参 与 人 1 C D A 2, 3 5, 2 B 3, 1 1, 5 * 混合策略的提出 混合策略的定义:在博弈G={N, Si, ui, i∈N}中,假设参与人i的纯策略构成的策略集合为Si={si1,…, sik},若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0≤pij ≤ 1,对于j=1 ,…, k都成立,且有, pi1+…+ pik=1 纯策略可看成特殊的混合策略 上述定义是在有限博弈前提下进行的 * 混合策略意义下的相关表述 混合策略意义下策略组合的表述 {x1∈X1, …, xn∈Xn},其中Xi , i =1, …, n表示参与人i所有纯策略生成的概率空间,xi为参与人i的一个具体混合策略 猜硬币博弈的一个混合策略就可记为{(1/2, 1/2),(1/2, 1/2)} * 混合策略 若允许每个参与人选择混合策略,则博弈结果就是一个关于纯策略组合得来一个风险结果 为研究参与人行为,需要知道各参与人对这些风险结果的偏好关系 博弈论假定每个参与人的偏好关系,可用期望收益函数表示。 * VNM效用函数 VNM效用函数理论是20世纪50年代,冯·诺依曼和摩根斯坦(Von Neumann and Morgenstern)在公理化假设的基础上,运用逻辑和数学工具,建立了不确定条件下对理性人(rational actor)选择进行分析的框架。 * VNM效用函数 如果某个随机变量X以概率Pi取值xi,i=1,2,…,n,而某人在确定地得到xi时的效用为u(xi),那么,该随机变量给他的效用便是: U(X) = P1u(x1) + P2u(x2) + ... + Pnu(xn) 表示关于随机变量X的期望效用。因此U(X)称为期望效用函数,又叫做冯·诺依曼—摩根斯坦效用函数(VNM函数)。 * 混合策略 于是可以定义基于混合策略意义下的博弈策略式表述 定义 基于(v-N-M效用的)策略式博弈由 参与人集合 每个参与人有一个(纯)策略集合 对于每一个参与人来说,由所有参与人纯策略组合构成的风险结果空间,存在一个v-N-M效用 The expected payoff of the mixed strategy Pi?is a weighted average of the expected payoffs of each of the pure strategies in the mix.? * * 混合策略意义下的纳什均衡 定义,对于博弈G= {N, Si, ui, i∈N},基于v-N-M效用的混合策略组合α*是一个纳什均衡,若对于每一个i, 以及i的任意一个混合策略αi,α*对应的期望支付至少和(αi,α*-i )的期望支付一样大 * 混合策略意义下的纳什均衡 换句话说,称混合策略组合α*是一个纳什均衡,如果没有一个参与人通过偏离策略α*i 实现支付的增加 Mixed Strategy NE A mixed strategy (P1*, P2*, … PN*),
您可能关注的文档
- 第4章 数据库的备份恢复与分离附加 SQL ppt 教学课件.ppt
- 第4章 数组、枚举和自定义数据类型 Visual Basic(VB) 教学课件.ppt
- 第4章 数控机床的伺服系统 《数控机床》教学课件.ppt
- 第4章 无线通信基本技术-GSM空中接口技术 无线定位技术 教学 课件.ppt
- 第4章 控矿因素与找矿标志.ppt
- 第4章 时间频率测量及调制域分析 《电子测量技术》课件.ppt
- 第4章 最优化搜索算法的结构与一维搜索 筹学与最优化方法-课件.ppt
- 第4章 服务产品的特征及其营销 特许经营导论 教学课件.ppt
- 第4章 机床设计总论 机械制造装备设计 教学课件.ppt
- 第4章 根轨迹分析法 《自动控制原理(第2版)》课件.ppt
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)