策略与博弈..ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈的游戏 博弈要素 纳什均衡博弈论的第一个重量级概念 混合策略 抓阄 用三张相同的纸,分别写上1、2、3。然后折起来混合,事前约定,抽到1、2,就去看歌剧,如果抽到3,就去看足球。然后让妻子随机抽一张,决定丈夫的行动。这样,丈夫就按照概率(1/3,2/3)取(足球,歌剧),生成混合策略c2。 摸球 将3个红球和两个黑球放在盒子里,约定取出红球去看歌剧,取出黑球去看歌剧。然后让妻子从盒子中随机取一个球决定丈夫的行动。丈夫就按照概率(2/5,3/5)取(足球,歌剧),生成混合策略c3。 如法炮制,我们可以生成无穷多混合策略。丈夫可以按照任意概率(p1,p2)取(足球,歌剧),只要满足p1+p2=1,p1,p2≥0。当p1=1或者p2=1时,就成了前面的纯策略。 归纳 混 合 策 略 假设局中人i有M个纯策略,s1,s2,s3,…,sM。对于在纯策略s1,s2,s3,…,sM上的任意分布: pM … p3 p2 p1 pi sM … s3 s2 s1 纯策略 满足 则称这个概率向量pi=(p1,p2,…,pM)为局中人i的混合策略。 局中人采用混合策略后,局中人的盈利函数就不能够简单由局势来决定。必须通过期望盈利来衡量混合策略的好坏。 7,0 2,0 2,5 底 5,4 2,5 3,5 中间 5,6 1,6 4,5 顶 右 中心 左 1\2 7,0 2,0 2,5 底 5,4 2,5 3,5 中间 5,6 1,6 4,5 顶 右 中心 左 1\2 7,0 2,0 2,5 底 5,4 2,5 3,5 中间 5,6 1,6 4,5 顶 右 中心 左 1\2 剔除过程演示 贰 划线法 给定局中人2的每个策略,对局中人1的相应盈利最大值划线 再给定局中人1的每个策略,对局中人2的盈利最大值划线 合成 两个值都划线的对应的策略就是两个局中人的最佳策略。 结果与剔除顺序有关 当策略之间的劣与优是强(非弱)的时候,最后结果与剔除顺序没有关系,但是当策略之间的劣与优是弱的(非强)的,则最后结果与剔除顺序有关。 案例6 一个市场存在一个垄断企业,另一个新的企业希望进入这一市场,垄断者为了保持自己的垄断地位,需要对进入者进行阻挠。这种对策中,进入者有两种策略:“进入”与“不进入”;垄断者也有两种策略:“默许”与“阻挠”。他们的盈利函数如下: 0,300 0,300 不进入 -10,0 40,50 进 入 阻 挠 默 许 进入者1\2垄断者 0,300 0,300 不进入 -10,0 40,50 进入 阻 挠 默 许 1\2 0,300 0,300 不进入 -10,0 40,50 进入 阻 挠 默 许 1\2 0,300 0,300 不进入 -10,0 40,50 进入 阻 挠 默 许 1\2 划线法 0,300 不进入 40,50 进入 默 许 1\2 40,50 进入 默 许 1\2 剔 除 法 根据划线法,该问题有两个最后局势: (进入,默许)和(不进入,阻挠)。但是,根据根据剔除法,我们根据占优策略剔除劣策略,而只能得到一个最后局势。所以今后在求解占优策略的时候,最好用划线法。 最 优 反 应 策 略 局中人i的策略si*与其他局中人的策略向量s-i*,如果他们满足: 则称si*是关于s-i*的最优反应。也就是假定其他局中人取定策略组合s-i*,那么局中人i采用的最好策略就是si*。 在对策中使用最优反应策略,必须有两个假设: 每个局中人必须采用自己猜测其他局中人的策略组合的最优反应策略。 这种猜测必须是正确的。 案例7 豪泰林竞争模型 假定有一个长度为1的线性城市,消费者均匀分布在这个区间内,有两个商店(工厂)位于这个城市的两端,出售同质产品,记商店1在x=0处,商店2在x=1处,,每个商店的单位成本为c。消费者一单位的交通成本为t,他们需要一个单位的商品,而且为这一个单位商品最多愿意支付s。两家商店的价格如何? 1 2 p1 p2 x D1(p1,p2)=x D2(p1,p2)=1-x D为需求函数 p1+tx p2+t(1-x) 实际支付 分析 需求分界点 需求函数 对策支付 函数(盈利) 求解最优反应策略(定价) 给定p2*,对p1求偏导,得到 给定p1*,对p2求偏导,得到 解释1 商店1猜测商店2采用(价格)策略p2*,那么商店1的最优反应策略是采用(价格)策略p1*(也就是说,如果商店1采用其它策略,他的盈利就会减少);同样,商店2猜测商店1采用(价格)策略p1*,那么,商店2最优反应策略是采用(价格)策略p2*。也就是说

您可能关注的文档

文档评论(0)

liudao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档