第7章博弈论混合策略.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 市场机会博弈 -50,-50 100,0 0,100 0,0 进 不 进 进 不进 厂商2 厂 商 1 市场机会 进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0 问题: 你跟舍友打球(羽毛球、乒乓球……), 假设可以打远球、近球,你的击打策略是? 请建模求解 其他例子 * * 足球点球 守门员 球员 左 右 左 50, 50 80, 20 右 90, 10 20, 80 单号为球员,双号为守门员,选择你的策略 选择纯策略 选择混合策略 如果守门员左边的扑球技巧提高,(50,50)-》(30.70),他是否应该更多地往右边射门? * 所有的运动都要使用混合策略 篮球:三分远投还是内线攻击 足球:近角、远角、高球、低球 棒球:快球、慢球、曲线球、膝关节球 打牌:诈叫 兵者,诡道也。 * 你和对方比牌的大小(斗地主、赌神) 你该如何下注? 大牌下大注,小牌下小注行不行? 有时候大牌下大注,有时候下小注,平均概率行不行? 以多大概率下大注,多大概率下小注? * * * * * * * * * * * * * * * * * * * * 蔡树彬 shubin@szu.edu.cn66162) 科技楼1406 * 第7讲 连续策略 基本定义:划拳博弈 支付均等化:小偷与守卫 导数法:政府救助 BR函数法:性别大战 * 划拳博弈 锤 剪 包 锤 剪 包 0,0 1,-1 -1,1 -1,1 0,0 1,-1 1,-1 -1,1 0,0 1 2 1. 写出1和2所有的最佳应对:BR1(锤2)=包1…. 2. 在上面的矩阵里把相应的最佳应对画上圈,这个博弈有没有占优策略? 有没有Nash均衡策略? 3. 使用箭头的方法再次寻找均衡 4. 假如是你来玩这个游戏,你将如何来玩这个游戏? * 不存在Nash均衡,如何应对? 假定对方是个高手,你愿意和他一局定胜负还是5局3胜? 假定对方是个低手呢? 假定5局3胜,对手“包包包包包”,你有什么策略获胜? 假定5局3胜,对手“包包剪包包”,你有什么策略获胜? 假定5局3胜,对手“包包锤剪包”,你有什么策略获胜? 假定5局3胜,你知道对手会出3包1锤1剪,但是不知道顺序,你有什么策略获胜? 假定3局2胜,你知道对手会出1包1锤1剪,但是不知道顺序,你有什么策略获胜? 假定1局定胜负,你知道对手喜欢出包,你有什么策略获胜? 假定1局定胜负,你知道对手随便乱出拳,你有什么策略获胜? * 划拳博弈 锤1 剪2 包3 锤1 剪2 包3 0,0 1,-1 -1,1 -1,1 0,0 1,-1 1,-1 -1,1 0,0 1 2 取胜关键:不能让另一方猜到自己的策略 尽可能猜出对方策略 * 混合策略的提出 利用生活经验不难知道,为了获胜,不能让对手知道自己要出什么,所以要用随机的方法来出拳,而且要等概率(为什么?) 在这个例子里,A的策略是(1/3锤,1/3剪,1/3包) 这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来 在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略 (pure strategies) * 混合策略的提出 博弈G={N, Ai, ui, i∈N} 参与人i的纯策略构成的策略集合为Si=Ai ={si1,…, sik}, 参与人i有j个不同的策略 混合策略:若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略” 0≤pij ≤ 1,对于j=1 ,…, k都成立 pi1+…+ pik=1 纯策略可看成特殊的混合策略 * 混合策略意义下的相关表述 混合策略空间: (pi1,…, pik) (si1,…, sik)T 混合策略意义下策略组合的表述 {x1∈X1, …, xn∈Xn},其中Xi , i =1, …, n表示参与人i的混合策略空间,xi为参与人i的一个具体混合策略 * 纳什均衡的存在性问题 每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略); 如果一个博弈存在两个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡 * 为什么要不能严打 加大打击力度 加大处罚力度(多判死刑) 加大酒驾的惩罚力度 猎虎行动 * 小偷和守卫的博弈 小偷和守卫的博弈 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 这个博弈的均衡是什么?概率是多大? 加重对小偷的处罚会有什么结果?(增大P值) 加重对守卫的处罚会有什么结果?(增

文档评论(0)

wx171113 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档