矩阵对策的最优纯策略.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
矩阵对策的最优纯策略

授课时间授课地点实到人数授课题目矩阵对策的求解授课专业班级教学目的与教学要求了解矩阵对策问题及其求解方法,以期对大家的工作、科研、学习和生活提供帮助主要内容矩阵对策的数学模型矩阵对策的最优纯策略矩阵对策的最优混合策略重点与难点?有鞍点的矩阵对策问题及求解?没有鞍点的矩阵对策问题及求解教学方法手段(教具)案例教学参考资料韩伯棠《管理运筹学》高等教育出版社胡运权《运筹学》高等教育出版社刁在筠、刘桂真《运筹学》高教出版社课后作业与思考题教学后记没有鞍点的矩阵对策的概念及求解的理解是一个难点,每个局中人采用每种策略的概率有何实际意义,用生活中的小故事引入使得学生更容易理解和认可。教学过程时间分配矩阵对策的求解在众多的对策模型中,占有重要地位的是二人有限零和对策(finite two-person zero-sum game),又称矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型,其研究思想和方法十分具有代表性,体现了对策论的一般思想和方法,且矩阵对策的基本结果也是研究其他对策模型的基础。(一)矩阵对策的数学模型矩阵对策即为二人有限零和对策。“二人”是指参加对策的局中人有两个;“有限”是指每个局中人的策略集均为有限集;“零和”是指在任一局势下,两个局中人的赢得之和总等于零,即一个局中人的所得值恰好等于另一局中人的所失值,双方的利益是完全对抗的。“齐王赛马”就是一个矩阵对策的例子,齐王和田忌各有6个策略,一局对策后,齐王的所得必为田忌的所失。一般,用Ⅰ和Ⅱ分别表示两个局中人,并设局中人Ⅰ有m个纯策略,局中人Ⅱ有n个纯策略;则局中人Ⅰ和Ⅱ的策略集分别为和。当局中人Ⅰ选定纯策略和局中人Ⅱ选定纯策略后,就形成了一个纯局势,这样的纯局势共有个。对任一纯局势,记局中人Ⅰ的赢得值为,称为局中人Ⅰ的赢得矩阵。局中人Ⅱ的赢得矩阵就是。当局中人Ⅰ,Ⅱ的策略集及局中人Ⅰ的赢得矩阵确定后,一个矩阵对策也就给定了,记为。在齐王赛马的例子中,齐王的赢得矩阵为:(二)矩阵对策的最优纯策略当矩阵对策模型给定后,各局中人面临的问题便是:如何选择对自己最有利的纯策略以取得最大的赢得(或最少的损失)?例1、甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得-1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三赛三负得-3分。甲队的策略集为,乙队的策略集为。根据以往比赛的资料,有甲队的赢得矩阵为,请问这次比赛各队采用哪种阵容上场最为稳妥?解:由可看出,局中人甲队的最大赢得为3,要得到这个赢得,他就应该选择策略。由于局中人乙队的理智,他考虑到甲队打算出的心理,于是准备用来对付甲队,这样使得甲队反而失掉1分……双方都考虑到对方为使自己尽可能的少得分而所做的努力,所以双方都不存在侥幸心理,而是从各自可能出现的最不利的情形中选择一种最为有利的情况作为决策的依据,这就是所谓的“理智行为”,也就是对策双方实际上都能接受的一种稳妥方法。甲队在各纯策略下可能得到的最少赢得,即矩阵A中每行的最小元素分别为:1,-3,-1,其中最好的结果是1,即甲队应采取策略,无论对手采用何种策略,甲队都能保证他得赢得不会少于1,而出其他策略,都有可能使甲队的赢得少于1甚至输给对方。同理,对于乙队来说,各纯策略可能带来最不利的结果,即矩阵A中没列的最大元素分别为:3,1,3,其中最好的也是1,即乙队应采取策略,无论对手采用何种策略,乙队都能保证他得所失值不会超过1,而选择其他策略,都有可能是自己的所失超过1.上述分析表明,甲队和乙队的理智行为分别是选择纯策略和,这时,甲队的赢得值和乙队的所失值的绝对值相等,甲队得到了其预期的最少赢得1,而乙队也不会给甲队带来比1更多的所得,相互的竞争使对策出现了一个最稳妥的结果。因此,和应分别为甲队和乙队的最优纯策略。定义1:设为一矩阵对策,其中,,。若 (1)成立,记其值为,则称为对策的值,称使(1)成立的纯局势为G在纯策略意义下的解(或鞍点),称分别为局中人Ⅰ和Ⅱ的最优纯策略。定理1: 矩阵对策在纯策略意义下有解的充要条件是:存在纯局势,使得对任意,有 (2)证明:先证充分性,由(2)有 而 所以 (3)另一方面,对任意,有所以 (4)由(3)(4)可知,且 再证必要性设有,使得则由有证毕。定理1中(2)式的对策意义是:一个平衡局势应该具有这样的性质:当局

文档评论(0)

shenlan118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档