- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运筹学—对策论(一) §1对策论的基本概念 * 一﹑对策行为和对策论 1﹒对策行为: 具有竞争或对抗性质的行为称为对策行为。 对策行为的实例: ⑴下棋﹑打牌﹑体育比赛等。 ⑵战争—在战争活动中的双方,都力图选取对自己最为有利的策略,千方百计去战胜对手。 ⑶政治—国际的谈判,各种政治力量之间的斗争,各国际集团之间的斗争等都具有斗争的性质。 ⑷经济—各国之间,各公司企业之间的各种经济谈判,企业之间为争夺市场而进行的竞争。 2﹒对策论 对策论是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。对策论也称为竞赛论或博奕论。 经典的对策论研究的例子:“齐王賽马” 战国时期,齐王有一天提出要与田忌进行賽马。双方约定:从各自的上中下三个等级马中各选一匹参赛,每匹均只能参赛一次,每次比赛双方各出一匹马,负者要付给胜者千金。已知:在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。 双方如何取胜? 根据条件可看出,两人各采取什么的样出马顺序对胜负是至关重要的。 二﹑对策行为的三个基本要素 1﹒局中人 在一个对策行为中,有权决定自己行动方案的对策参加者,称为局中人。通常用I表示局中人的集合。如果n个局中人,则I={1,2,…,n}。 说明: ①对策中关于局中人的概念是具有广义性的。局中人除了可理解为个人外,还可以理解为一集体,如球队﹑交战国﹑企业等,以及研究自然界中某个现象时,可把这个现象看成一个局中人。 ②在对策中总是假定每一个局中人都是“理智的”决策者或竞争者。即对任一局中人来讲,不存在利用其它局中人决策的失误来扩大自身利益的可能性。 2﹒策略集 策略 策略集 如:在“齐王赛马”中,如果用(上,中,下)表示以上马﹑中马﹑下马依次参赛这样一个次序,这就是一个完整的行动方案,即为一个策略。 一局对策中,可供局中人选择的一个实际可行的完整的行动方案,称为一个对策。 设i为局中人,i的所有策略构成的集合Si称为i的策略集。 3﹒赢得函数 局势: 在一局对策中,各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略,则n个局中人的策略组s={s1, s2,…, sn}就是一个局势。 全体局势的集合S可用各局中人策略集的笛卡尔乘积表示,即S=S1× S2×… × Sn 赢得函数:当局势出现后,对策的结果也就确定了。也就是说,对任一局势s∈S,局中人i可以得到一个赢得Hi(s)。 显然, Hi(s)是局势s的函数,称之为第i局中人的赢得函数。 当局中人,策略,赢得函数三个因素确定后,一个对策模型也就给定了。 再如:α2 =(上,下,中), β 1 =(上,中,下),则在局势s21下齐王的赢得值H1(s21)=1,田忌的赢得值H2(s21)=﹣1。如此等等. 如:在“齐王赛马”中,局中人集合I={1,2},齐王和田忌的策略集可分别用S1={α1, α2, α3 , α4 , α5 , α6}和S2={β1 ,β 2, β 3 , β 4 , β 5 , β 6}表示。这样,齐王的一个策略αi和田忌的一个策略β j就决定了一个局势sij 。 如果α1 =(上,中,下), β 1 =(上,中,下),则在局势s11下齐王的赢得值H1(s11)=3,田忌的赢得值H2(s11)=﹣3。 三﹑对策的分类 对策 静态对策 动态对策 结盟对策 不结盟对策 联合对策 合作对策 有限 无限 二人 多人 零和 非零和 零和 非零和 二人 多人 零和 非零和 零和 非零和 微分对策等 重点学习的对策。 §2矩阵对策的基本定理 一﹑矩阵对策的数学模型 1﹒二人有限零和对策: 是指有两个参加对策的局中人,每个局中人都只有有限个策略可供选择,在任一局势下,两个局中人的赢得之和总等于零。 2﹒矩阵对策: 就是二人有限零和对策。 3﹒矩阵对策模型 设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局中人Ⅰ对任一纯局势( αi, β j )的赢得值为aij,并称 a11 a12 …a1n . .
文档评论(0)