二、图解法 例2.设矩阵对策G={S1,S2;A},其中 S1={α1,α2},S2={β1,β2,β3}.试用图解法求解. 解:设局中人I的混合策略为(x1,1-x1)T ,x1∈[0,1]. 做两条垂线P0(x1=0)和P1(x1=1), P0 P1 表示局中人I分别取纯策略 β3 11 α2和α1 .垂线P0上的值表 7 β1 示局中人I取α2时,局中人 5 B β2 Ⅱ取各βj时的赢得值.同理, 2 S 23 垂线P1上的值表示局中人I取 0 A 1 α1时,局中人Ⅱ取各βj时的赢得值. 图1 P0 图1 P1 β3 11 7 5 β1 B β2 3 2 S 2 0 A 1 如图1,当局中人I选择策略(x1,1-x1)T时,其 最少可能的收入是局中人Ⅱ选择β1,β2 ,β3时 所确定的三条直线 2x1+7(1-x1)=v 3x1+5(1-x1)=v 11x1+2(1-x1)=v 在x1处的纵坐标中之 最小者.所以局中人I 按max min原则,应选择 x1=OA,而AB即为对策值. 运筹与优化 第十四章 对策论 对 策 论 对策论的基本概念 对策论的基本定理 矩阵对策的解法 第一节 对策论的基本概念 对策论亦称竞赛论或博奕论,是研究具有斗 争或竞争性质的数学理论和方法. 具有竞争或对抗性质的行为称为对策行为. 对策论是研究对策行为中竞争各方是否存在 最合理的行动方案,以及如何找到最合理方案的 数学理论和方法. 具有对策行为的模型称为对策模型,或对策. 对策三要素 局中人:在一个对策行为中,有权决定自己行动 方案的对策者.n个局中人的集合I={1,2,…,n}. 理智的决策者:不存在侥幸心理者. 策略集:可供局中人i选择的一个实际可行的完 整的行动方案称为一个策略si,策略集Si. 局势:在对策中,各局中人所选定的策略构成的 策略组s=(s1, s2,… sn).全体局势S=S1×S2×…×Sn 赢得函数:局势s的函数Hi(s). 矩阵对策:二人有限零和对策. 第二节 对策论的基本定理 局中人I的纯策略集 S1 ={α1 ,α2 , … αm};局中人Ⅱ的纯策略集S2 ={β1 ,β2 , … βn}; 对任一纯局势(αi,βj) (共m×n个),局中 人I的赢得值为aij ,赢得矩阵为A=(aij)m×n . 局中人Ⅱ的赢得矩阵为-A. 矩阵对策记为 G={Ⅰ,Ⅱ,S1,S2;A} 或 G={S1,S2;A}. 田忌 齐王 β1 (上中下) β2 (上下中) β3 (中上下) β4 (中下上) β5 (下中上) β6 (下上中) α1 (上中下) α2 (上下中) α3 (中上下) α4 (中下上) α5 (下中上) α6 (下上中) 3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3 例1.“齐王赛马”中,齐王的赢得矩阵为: 最优策略:有利于自己获得最大赢得(或最少损失)的策略. 选择最优策略的原则:牢记对方总是以最 不利于你的行动方案来对付你. 例2.设矩阵对策G={S1,S2;A},其中 S1={α1,α2,α3,α4}, S2={β1,β2,β3}, 试求双方的最
原创力文档

文档评论(0)