- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈要素 纳什均衡博弈论的第一个重量级概念 混合策略 期望盈利的计算 第一步,对每一个纯策略的盈利采取对该策略的概率加权; 第二步,把加权了的盈利合计在一起。 算例 丈夫以(1/3,2/3)取(足球,歌剧),妻子采用纯策略。 情侣博弈 妻 子 歌剧 足球 (足球,歌剧) (足球,歌剧) (1/3,2/3) 丈夫 3,0 0,1 1 也就是说,丈夫的期望盈利依赖于妻子的选择。而妻子的盈利仍然按照前面的计算。因为她还不知道丈夫的选择机制如何? 丈夫以(1/3,2/3)取(足球,歌剧),妻子采用混合纯策略(1/2,1/2)取(足球,歌剧)。则丈夫的期望盈利为 2 1/2 1/2 概率 2/3 (1,3) (0,0) 歌剧 1/3 (0,0) (3,1) 足球 概率 歌剧 足球 丈夫\妻子 注意到妻子和丈夫的选择相互独立(互不影响),那么按照离散随机向量的数学期望的计算方法有: 丈夫盈利 妻子盈利 0,300 0,300 不进入 -10,0 40,50 进入 阻 挠 默 许 1\2 0,300 0,300 不进入 -10,0 40,50 进入 阻 挠 默 许 1\2 0,300 0,300 不进入 -10,0 40,50 进入 阻 挠 默 许 1\2 划线法 0,300 不进入 40,50 进入 默 许 1\2 40,50 进入 默 许 1\2 剔 除 法 根据划线法,该问题有两个最后局势: (进入,默许)和(不进入,阻挠)。但是,根据根据剔除法,我们根据占优策略剔除劣策略,而只能得到一个最后局势。所以今后在求解占优策略的时候,最好用划线法。 最 优 反 应 策 略 局中人i的策略si*与其他局中人的策略向量s-i*,如果他们满足: 则称si*是关于s-i*的最优反应。也就是假定其他局中人取定策略组合s-i*,那么局中人i采用的最好策略就是si*。 在对策中使用最优反应策略,必须有两个假设: 每个局中人必须采用自己猜测其他局中人的策略组合的最优反应策略。 这种猜测必须是正确的。 案例7 豪泰林竞争模型 假定有一个长度为1的线性城市,消费者均匀分布在这个区间内,有两个商店(工厂)位于这个城市的两端,出售同质产品,记商店1在x=0处,商店2在x=1处,,每个商店的单位成本为c。消费者一单位的交通成本为t,他们需要一个单位的商品,而且为这一个单位商品最多愿意支付s。两家商店的价格如何? 1 2 p1 p2 x D1(p1,p2)=x D2(p1,p2)=1-x D为需求函数 p1+tx p2+t(1-x) 实际支付 分析 需求分界点 需求函数 对策支付 函数(盈利) 求解最优反应策略(定价) 给定p2*,对p1求偏导,得到 给定p1*,对p2求偏导,得到 解释1 商店1猜测商店2采用(价格)策略p2*,那么商店1的最优反应策略是采用(价格)策略p1*(也就是说,如果商店1采用其它策略,他的盈利就会减少);同样,商店2猜测商店1采用(价格)策略p1*,那么,商店2最优反应策略是采用(价格)策略p2*。也就是说,p1*和p2*互为最优反应。 解释2 商店1和2的最优反应是建立在外部环境给定的情况下的最优反应。这两个最优反应需要根据外部环境参数变化而变化,因为 p1*=p2*=c+t 当c和t发生改变的时候,两个最优反应都相应发生改变。 解释3 当c和t增加超过一定限度,即总支付超过了消费者的支付能力(最多愿意支付),那么,消费者就从商店1和商店2流失。由于 即c和t也应该受到消费者的支付能力的约束!! 纳 什 均 衡 在案例7中,局中人(两个商店)分别猜测对方会用策略(价格)p1*和p2*,谁偏离了这个策略,都会吃亏。所以,局中人都有没有偏离(p1*,p2*)的动机。也就是说,在这个对策中,局中人分别选择策略(p1*,p2*)是稳定的。称这样的策略向量(p1*,p2*)为纳什均衡。 策略向量s*=(s1*,s2*,…,sn*),如果满足条件: 则称s*是纳什均衡。 也就是说,如果局中人i正确的猜测其它局中用人的策略向量为s-i*,那么,他的最优反应是si*,如果偏离了这个策略,他的盈利就会下降。同样的道理,每个局中人都有这样的猜测,那么,谁都不会偏离这个均衡策略向量。即纳什均衡具有稳定性。 思考1 局中人都存在强优策略,那么,这种由强优策略组成的策略向量是不是纳什均衡? 思考2 纳什均衡是唯一的吗?利用弱优策略说明。 思考3 是不是所有的对策都有纳什均衡? 思考4 局中人都有多个策略,他们怎么达到纳什均衡?想一
文档评论(0)