- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1章:对策论[高级运筹学-中南大学徐选华]
第 1 章:对策论;例1-2.两小孩玩石头、剪刀、布的游戏:甲、乙两小孩出的手势都有可能是石头、剪刀、布,
若他们三次出的手势如下图,则乙小孩二胜一负。
;四、对策
参加竞争的各方为了取胜,而研究出一组对付对方的策略。
五、对策的三要素
1· 局中人:参加竞争,并有决策权的各方(二人或多人)。
如:齐王和田忌。
2· 策略:在一局竞争中,每一局中人均有供他选择的实际可行的完整行动方案。
如例1-1,齐王有6个策略:{(上中下),(上下中), (中上下), (中下上),(下上中), (下中上)}
田忌有6个策略:{(上中下),(上下中), (中上下), (中下上),(下上中), (下中上)}
如例1-2,甲小孩有3个策略:{石头,剪刀,布}
乙小孩有3个策略:{石头,剪刀,布}
3· 一局对策的得失:局中人的得失。叫支付函数,对有限策略集,叫支付矩阵。
如:???王出策略(上中下),田忌出策略(中上下),
则齐王二胜一负,赢得1千金;田忌损失1千金。
六、局势
每个局中人从各自的策略集合中选取一个策略参加对策,形成的一个处于竞争的策略组。
如:齐王选策略(上中下),田忌选策略(中上下),构成一个局势{(上中下),(中上下)}。
局势的得失总和为0。
七、对策的分类;对策;1.2 支付矩阵有鞍点的二人有限零和对策
一、特点
1· 策略公开。
2· 得失确定且总和为零:一方所得必为另一方所失,局中人利益冲突(对抗对策)。
3· 单局竞争决定胜负。
二、建模:建立支付函数,这里是支付矩阵(也叫矩阵对策问题)
设局中人甲有m个纯策略 S甲= {?1,?2,…,?m},局中人乙有n个纯策略 S乙= {?1,?2,…,?n}。
纯局势(?i,?j)得失为aij:当aij>0时,甲赢得aij,乙损失aij;
当aij<0时,甲损失-aij,乙赢得-aij。
构成支付矩阵 A:
; 如例1-1.齐王与田忌赛马:
; 如例1-2.两小孩玩游戏:
;例1-3.某单位秋季要决定冬季取暖用煤的贮量。冬季用煤贮量在较暖、正常和较冷情况下分为
10、15和20吨。设冬季煤价也随寒冷程度而变,在上述三种情况下分别为340、420和500元/吨,
已知秋季煤价为340元/吨,冬季气象未能予知,问秋季合理贮煤量为多少?
解:建模,设局中人甲为:贮煤量决策者;
局中人乙为:未来冬季气候。
费用总和=秋季贮煤量费用+冬季补购煤量费用;二、求解
1· 稳妥性原则
局中人在公开对策的前提下,都从最坏处着想,在最坏的环境中争取最好的结果。
例1-4 某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。他们根据企业的
发展战略和群众关心的事业各自提出了企业改革的方案。甲提出了四种:?1,?2,?3,?4;
乙提出了三种:?1,?2,?3。他们的参谋人员为使竞争对本方有利,予先作了个民意抽样
测验。因各方提供的不同策略对选票吸引力不同。测验选票经比较后差额如下表
(单位:十张):
; 2· 稳妥性原则数学表达:
①对甲而言是最小最大原则:从支付矩阵每行元素中取最小数,再从这些最小数中取最大数,得;例1-5 某厂工程师设计了三个矿石冶炼(或选矿)流程,考虑到它们的所用设备和工艺环节等因素,
若付诸实施可会遇上生产正常和生产不正常两种情况,这两种情况的出现及其概率未能予知,
但三个流程在这两种情况下的单位支付费用已算出,如下表,问:选用哪个流程较好?
;1.3 支付矩阵无鞍点的二人有限零和对策
一、特点
1· 策略保密性:图谋出奇制胜。
2· 得失随机性:某局竞争的胜败难于予料,强者可败,弱者可胜。
3· 多局竞争性:多局竞争后决定胜负。
二、建模:建立得失期望值函数
1· 混合策略
设局中人甲有m个纯策略 S甲={?1,?2,…,?m},局中人乙有n个纯策略 S乙={?1,?2,…,?n}。
纯局势(?i,?j)得失为aij,构成的支付矩阵A无鞍点。G = {甲,乙,S甲,S乙,A}。
设甲以 x1,x2,…,xm 的概率取纯策略 ?1,?2,…,?m ,
则称概率向量 X = (x1,x2,…,xm)为甲的一个混合策略,xi≥0,x1+x2+…+x
文档评论(0)