运筹学—对策论一.ppt

下载文档 降价啦

11
0
约4.04千字
约 14页
2019-07-18 发布于江西
举报
版权申诉
保障服务

运筹学—对策论一.ppt

1、本文档共14页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

运筹学—对策论(一) §1对策论的基本概念 * 一﹑对策行为和对策论 1﹒对策行为：具有竞争或对抗性质的行为称为对策行为。对策行为的实例： ⑴下棋﹑打牌﹑体育比赛等。 ⑵战争—在战争活动中的双方，都力图选取对自己最为有利的策略，千方百计去战胜对手。 ⑶政治—国际的谈判，各种政治力量之间的斗争，各国际集团之间的斗争等都具有斗争的性质。 ⑷经济—各国之间，各公司企业之间的各种经济谈判，企业之间为争夺市场而进行的竞争。 2﹒对策论对策论是研究对策行为中斗争各方是否存在着最合理的行动方案，以及如何找到这个合理的行动方案的数学理论和方法。对策论也称为竞赛论或博奕论。经典的对策论研究的例子：“齐王賽马” 战国时期，齐王有一天提出要与田忌进行賽马。双方约定：从各自的上中下三个等级马中各选一匹参赛，每匹均只能参赛一次，每次比赛双方各出一匹马，负者要付给胜者千金。已知：在同等级的马中，田忌的马不如齐王的马，而如果田忌的马比齐王的马高一等级，则田忌的马可取胜。双方如何取胜？根据条件可看出，两人各采取什么的样出马顺序对胜负是至关重要的。二﹑对策行为的三个基本要素 1﹒局中人在一个对策行为中，有权决定自己行动方案的对策参加者，称为局中人。通常用I表示局中人的集合。如果n个局中人，则I={1，2，…，n}。说明： ①对策中关于局中人的概念是具有广义性的。局中人除了可理解为个人外，还可以理解为一集体，如球队﹑交战国﹑企业等，以及研究自然界中某个现象时，可把这个现象看成一个局中人。 ②在对策中总是假定每一个局中人都是“理智的”决策者或竞争者。即对任一局中人来讲，不存在利用其它局中人决策的失误来扩大自身利益的可能性。 2﹒策略集策略策略集如：在“齐王赛马”中，如果用（上，中，下）表示以上马﹑中马﹑下马依次参赛这样一个次序，这就是一个完整的行动方案，即为一个策略。一局对策中，可供局中人选择的一个实际可行的完整的行动方案，称为一个对策。设i为局中人，i的所有策略构成的集合Si称为i的策略集。 3﹒赢得函数局势: 在一局对策中，各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略，则n个局中人的策略组s={s1， s2，…， sn}就是一个局势。全体局势的集合S可用各局中人策略集的笛卡尔乘积表示，即S=S1× S2×… × Sn 赢得函数：当局势出现后，对策的结果也就确定了。也就是说，对任一局势s∈S，局中人i可以得到一个赢得Hi(s)。显然， Hi(s)是局势s的函数，称之为第i局中人的赢得函数。当局中人，策略，赢得函数三个因素确定后，一个对策模型也就给定了。再如：α2 =（上，下，中）， β 1 =（上，中，下），则在局势s21下齐王的赢得值H1(s21)=1，田忌的赢得值H2(s21)=﹣1。如此等等. 如：在“齐王赛马”中，局中人集合I={1，2}，齐王和田忌的策略集可分别用S1={α1， α2， α3 ， α4 ， α5 ， α6}和S2={β1 ，β 2， β 3 ， β 4 ， β 5 ， β 6}表示。这样，齐王的一个策略αi和田忌的一个策略β j就决定了一个局势sij 。如果α1 =（上，中，下）， β 1 =（上，中，下），则在局势s11下齐王的赢得值H1(s11)=3，田忌的赢得值H2(s11)=﹣3。三﹑对策的分类对策静态对策动态对策结盟对策不结盟对策联合对策合作对策有限无限二人多人零和非零和零和非零和二人多人零和非零和零和非零和微分对策等重点学习的对策。 §2矩阵对策的基本定理一﹑矩阵对策的数学模型 1﹒二人有限零和对策：是指有两个参加对策的局中人，每个局中人都只有有限个策略可供选择，在任一局势下，两个局中人的赢得之和总等于零。 2﹒矩阵对策：就是二人有限零和对策。 3﹒矩阵对策模型设Ⅰ﹑Ⅱ分别表示两个局中人，且它们的纯策略集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局中人Ⅰ对任一纯局势（ αi, β j ）的赢得值为aij,并称 a11 a12 …a1n . .