数学建模MCM 对策论.docVIP

下载本文档

2
0
约2.95千字
约 4页
2020-03-18 发布于山东
举报
版权申诉

数学建模MCM 对策论.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE 5 PAGE 3 对策型决策当决策系统中的自然状态是由竞争对手的策略（行动方案）决定的时候，这种情况下的决策就构成了对策型决策。与上不同的是此时的自然状态的出现是由人决定的，甚至是比你聪明的对手出的招数。对策论是研究对策型决策的数学学科，即在不完全知道对方行动或意图的条件下构建和研究的数学决策模型。对策论（Game Theory）又称为博弈论，是研究带有竞争与对抗问题的理论与方法。在现实生活中，我们常常看到双方对抗、竞争的现象，例如从日常生活中的下棋、游戏到政治、军事上的斗争，以及经济领域各个企业的相互竞争，均属此类现象。最著名的例子是田忌赛马和乒乓球团体赛队员出场名单及出场顺序。在有对抗性和竞争性现象中，斗争的各方总是希望自己一方最终取得胜利或获的尽可能好的结局。但是总会遭遇对方的干扰、破坏、抵抗或进攻。在这种情况下人们想获得尽可能好的结局，必须考虑对手可能怎样采取策略，从而选取自己的一个好的对付策略。对策型决策的三要素： 1局中人：具有决策权的双方（或多方）称为局中人。如棋局中的对弈双方，战争中敌我双方的司令员等。 2 策略：是指决策者为了战胜对手所可能选择的行动方案。所有策略一起构成一个策略集。每个局中人各有一个策略集。 3 局势和支付函数：在对策型决策问题中，每一个局中人从各自的策略集中任取一个策略，组成的策略组称为一个局势。局势直接导致的结果是局中人是失败还是成功，对它的定量表述在一般经济问题中称为支付函数。支付函数是以局势为自变量，以局中人的得失为因变量的函数。我们下面主要讨论零和对策和矩阵决策。所谓零和决策是指：若在任意局势中，全体局中人的得与失相加等于零，这种决策称为零和决策。又当只有两个局中人且他们的策略集均是有限集时，支付函数可用矩阵表示，称此时的零和对策为矩阵决策。矩阵对策及其数学模型：局中人Ⅰ的m个纯策略S1={α1，α2，…αm}。局中人Ⅱ的n个纯策略S2={β1，β2，…βn}。支付矩阵：A=(aij)m*n称为局中人Ⅰ的赢得矩阵(或局中人Ⅱ的损失矩阵),即aij表示在局势(αi,βj)的情况下局中人Ⅰ赢得的值（等于局中人Ⅱ损失值）。我们的立场是局中人Ⅰ。 G=＜S1，S2，A＞即为矩阵决策的数学模型。其中，局中人，策略集、支付矩阵为矩阵决策的三要素。矩阵对策的求解原则：矩阵决策的求解就是斗争的双方为谋求各自的最大收益，决定双方采取的策略。故原则应为任何一方在选择任何策略时，都要考虑到对方总是可能采取最不利于这个策略的行动方式来对抗。基于这个原则，双方采取的策略都是谨慎、保守、不冒风险的。具体方法即“最大最小化原则”。相应从局中人Ⅱ的角度而言，应选取“最小最大化原则”。一：最优纯策略（有鞍点的矩阵策略）：鞍点概念，在有鞍点的矩阵策略的情况下，其在纯策略的意义下是有唯一解的。例1：《运筹学》355页分析：双方必然要设法不冒风险，从不利情况出发使自己赢得最大。即局中人Ⅰ应当采取从最坏的情形中选择最为有利的一种。max i min j＝max i{-1, 3, -8}=3=a32；局中人Ⅱ的角度而言，应采取从最大损失的情形中选择最小的一种。min j max i ＝min j{6, 10, 3}=3=a32。上例中双方均选择了32这点,a32称为支付矩阵的鞍点，即此矩阵策略的解。此时双方可采用双方均认可的纯策略，即局中人Ⅰ采用3号策略，局中人Ⅱ采用2号策略。二：混合策略（无鞍点的矩阵策略）：当矩阵决策没有鞍点时，在纯策略的意义下是无解。此时两个局中人面对这种情况应该在最大最小化原理的原则下应在其策略集中选取一些策略，并以一定的概率随机地使用，即应该使用混合策略。此时问题就转化为求这些选取的纯策略的使用概率各是多少。其数学模型形式： G=＜S1，S2，A＞， S1={α1，α2，…αm}， S2={β1，β2，…βn}， A=(aij)m*n 若局中人从各自的纯策略集合中选取各纯策略的使用概率用概率向量表示： X=(x1，x2，…，xm) （xI=0，i=1，2，…，m，） Y=(y1，y2，…，yn) （yI=0，j=1，2，…，n，）则X，Y分别称为局中人Ⅰ和局中人Ⅱ的混合策略（简称策略）。其中xi（yj）表示局中人Ⅰ（Ⅱ）选取αi（βj）的概率。而（X，Y）称为混合局势。由于两个局中人选取策略是相互独立的，随机的，故局势(αi,βj)出现的概率是xiyj，由支付矩阵看此时局中人Ⅰ赢得的值是aij。于是在混合局势（X，Y）下局中人Ⅰ赢得的期望支付是 E(X，Y)= 局中人Ⅰ的所有混合策略集合记为S1*={ X }；局中人Ⅱ的所有混合策略集合记为S2*={