- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]运筹学-对策论
7.1 引言 对策也叫博弈,是自古以来政治家和军事家都很注意研究的问题。作为一门学科是在20世纪40年代形成并发展起来的。 指导1944年冯诺依曼与摩根斯特恩的《博弈论与经济行为》一书出版,标志着现代系统博弈论的初步形成。 在日常生活中,经常可以看到一些具有相互斗争或竞争性质的行为,如下棋、打牌、体育比赛等。还有企业间的竞争、军队或国家间的战争、政治斗争等,都具有对抗的性质。这种具有竞争或对抗性质的行为称为对策行为。在这类行为中,各方具有不同的目标和利益。为实现自己的目标和利益,各方必须考虑对手可能采取的行动方案,并力图选择对自己最为有利或最为合理的行动方案。 例如,我国战国时期的“齐王赛马”就是典型的对策行为。 对策论的基本概念 三个基本要素; 1.局中人: 在一个对策行为中,有权决定自己行动方案的对策参加者。如“齐王赛马”的例子中,局中人是齐王和田忌,即参与对抗的各方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略。 某局中人的所有可能策略全体称为策略集; 3. 赢得函数 各局中人分别选定自己的策略构成的策略组称为一个局势,当局势出现后,对策的结果也就确定了。对于局势s,局 中人i可以得到一个赢得Hi(s),它是局势s的函数,称为局中人i的赢得函数。 “齐王赛马”齐王在各局势中的益损值表(单位:千金) 其中: 齐王的策略集: S1={?1,?2,?3,?4,?5,?6} 田忌的策略集:S2={?1,?2,?3,?4,?5,?6} 下列矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 对策的分类: 1)按局中人的多少分为二人对策和多人对策。 2)按策略集中策略的有限或无限,分为有限对策和无限对策。 3)按各局中人赢得函数的代数和是否为零,分为零和对策和非零和对策。 在众多对策模型中,占有重要地位的是二人有限零和对策,又称为矩阵对策。矩阵对策可以说是一类最简单的对策模型,其研究思想和方法十分具有代表性,体现了对策论的一般思想和方法,且其基本的结果也是研究其他对策模型的基础。 二人有限零和对策:(又称矩阵策略) 局中人为2; 每局中人的策略集中策略数目有限; 每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。 7.2 矩阵对策纯策略意义下的解 矩阵对策就是二人有限零和对策,是指有两个参加对策的局中人,每个局中人都只有有限个策略可供选择。设两个局中人为Ⅰ、Ⅱ,它们各自的策略集为 S1={α1,α2,…,αm} S2={β1,β2,…,βn} 当局中人Ⅰ选定纯策略αi,局中人Ⅱ选定纯策略βj后,就形成了一个纯局势(αi,βj),这样的纯局势共有m·n个。 对任意纯局势(αi,βj),记局中人I的赢得值为aij,并称 a11 a12 ˙˙˙a1n a21 a22 ˙˙˙a2n A= ˙ ˙ ˙ ˙ ˙ ˙ am1 am2 ˙˙˙amn 为局中人I的赢得矩阵(或为局中人II的支付矩阵),由于假定策略为零和的,故局中人II的赢得矩阵就是 –A。 对任一纯局势(αi,βj),记局中人Ⅰ的赢得值为aij,则得矩阵 A=(aij),称为矩阵人Ⅰ的赢得矩阵。由于是零和对策,则矩阵人Ⅱ的赢得矩阵为-A。矩阵对策的名称正是由此而来。通常把矩阵对策记为 G={Ⅰ,Ⅱ;S1,S2;A} 或 G={S1,S2;A} G = {S1, S2, A} 甲的策略集 甲的赢得矩阵 乙的策略集 “齐王赛马”即是一个矩阵策略. 2.矩阵对策的最优纯策略 在甲方赢得矩阵中: A=[aij]m*n i行代表甲方策略 i=1,2…m J列代表乙方策略 j=1,2…n aij代表甲方取策略i,乙方取策略j,这一局势下甲方的益损值,此时乙方的益损值为-aij(零和性质)。 在讨论各方采用的策略是必须注意一个前提就是对方是理智的。这就是要从最有把握取得的益损值情况考虑。 2.矩阵对策的最优纯策略 例:有交易双方公司甲和乙,甲有三个策略?1,?2,?3;乙有四个策略?1,?2,?3,?4,根据获利情况建立甲方的益损值 赢得矩阵。
文档评论(0)