课件:九运筹学博弈论.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
例5 B A 90 100 110 110 100 90 120 100 80 解:设A的混合策略为 B的混合策略为 解 得到 例6 求齐王与田忌赛马中双方的最优混合策略 解:齐王的线性规划为 解得齐王的最优混合策略为 问题:理论上齐王应赢得一千金,但是实际比赛中他为什么输掉一千金? 在无鞍点的矩阵博弈中,双方采取何种纯策略是应当保密的. 3.无鞍点矩阵博弈的布朗(Brown)算法 布朗(Brown)算法是一种近似算法,给定局中人A的收益矩阵 算法步骤: 1.甲方任选一行,然后乙方选择与该行中最小元素相对应的那一列; 2.在第1步里乙方所选的列中,与最大元素相对应的行即为甲方应选的行; 3.乙方把到目前为止甲方选择的各行求和,并选择与最小和元素对应的列; 4.甲方把到目前为止乙方选择的列求和,并选择与最大和元素对应的行.如果要求迭代的次数已达到,转第5步,否则转回第3步; 5.分别计算博弈值 的上界 和下界 6.令 是甲方选择i行的次数比例; 是乙方选择j列的次数比例. 分别为甲,乙的近似混合策略. 例7 用布朗算法求解矩阵博弈(迭代10次) 1 2 3 4 5 6 7 8 9 10 1 3 -2 2 1 1 6 3 2 10 5 3 11 3 6 15 5 7 19 7 8 23 9 9 27 11 10 31 13 11 1 2 3 4 5 6 7 8 9 10 3 1 4 7 5 3 1 4 7 10 -2 1 -1 -3 0 3 6 4 2 0 1 3 4 5 7 9 11 12 13 14 四.纳什均衡(Nash equilibrium) 纳什均衡是博弈论的基础.在二人零和博弈中,双方寻求的最优解是一种均衡解,达到这种均衡时,无论是纯策略解还是混合策略解,只要其他局中人不改变自己的策略,则任何一方单独改变自己的策略只能带来收益或效用的减少,因此这些均衡解也称为纳什均衡,换言之,纳什均衡是一种策略组合,它是每个局中人的策略对其他局中人策略的最优反应.纳什证明了在任何非合作有限博弈中,都存在至少一个纳什均衡. §3.完全信息静态博弈(二) 现在研究二人非零和博弈 B A 策 略 策 略 一.用划线法求具有纯策略的纳什均衡 例7 二人博弈如下表所示 B A 解:先利用策略的优超性简化双元矩阵. B A 纳什均衡是每个局中人策略对其他局中人策略的最优反应.对于A来说,针对B分别采取策略 时, A的最优反应分别是策略 其收益值分别是5,6,4.按划线法,在这几个数字下分别划一横线;对于B来说,相对于A采取的策略 ,B的最优反应策略是 ,分别在对应的收益值6,6下划横线. 如果收益值 下都有横线,这一对值就是纳什均衡解,对应的策略组合为 本题中,纳什均衡解为(4,6),对应的策略组为 B A 纳什均衡解为(4,6),对应的策略组为 二.两个著名的博弈例子 例8 囚徒困境问题:(1950年数学家塔克任美国斯坦福大学教授,在给一些心理学家讲演时,对当时正在研究的博弈问题作了形象的描述)设有甲,犯乙两名嫌疑因同一桩罪行被捕,警方希望他们坦白并提供对方犯罪证据,规定如两人均坦白各判刑3年;如一方坦白另一方不坦白,坦白一方从轻释放,不坦白一方判刑8年;如两人均不坦白,由于犯罪事实证据很多不能成立,只能每人各判1年,分析甲,乙两名犯罪嫌疑人的各自策略和纳什均衡解. 解: 乙 甲 坦白 不坦白 坦白 不坦白 (-3,-3) (0,-8) (-8,0) (-1,-1) 根据划线法纳什均衡解是(坦白,坦白).但是从表中明显看出,两名犯罪嫌疑人最好的结局是 (-1,-1),即双方均不坦白.如何理解这一矛盾的结果呢?这个例子说明,就个人利益和群体利益而言,在考虑最优解时,出发点不同,结果也不同,个人的理性选择与群体的理性选择是不一致的.在某些情况下,群体的理性选择反而比个人

文档评论(0)

iuad + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档