- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对策论与极大极小控制 ;10.1 概述; 对策论又称为博弈论(Game Theory),是由冯?诺依曼(John Von Neumann)和奥?摩根斯特思(Osker Morgenstern)于1944年首先创立的,它在经济竞争、军事冲突中获得了广泛的应用。微分对策研究的是动态情况下的对策理论。它是由依蕯克斯(R Isaacs)首先创立的。在二次世界大战期间,由美国空军赞助,美国兰德公司组织了以依蕯克斯博士为首的研究小组开展了对抗双方都能自由决策行动的追逃问题的研究。1965年,依蕯克斯将研究成果整理出版了《微分对策》一书,此书的出版标志了微分对策的正式诞生。; 本章将先讨论离散对策(又称矩阵对策,策略取离散值)和连续对策(策略取连续值),进而讨论本章的重点——微分对策(用微分方程描述的动态情况下的对策)。;10.2 离散对策(矩阵对策) 10.2.1 对策的极小极大值(纯策略解); 设厉害冲突双方 和(局中人)各有一套策略,即 和 , , 。与每一对策略( , )相对应,产生出一个支付: 。 方力图使 支付最大,而 方则试图使之最小。由 可构成一个支付矩阵。设 ,一个支付矩阵的例子如图10-1所示;; 假设 (求极大值者)先开局,若选择策略 ,这时 的值为 ,因 ,故随后 方会选择 使 。另一方面,方若选择 ,这时 的值为 , 。比较; 再假设 先开局,类似地,选 时 ,选 时 ,而 ,故 方应选择策略 这是有“较小极大值”7的第一行。这时不管 方取何策略, 方的赢得不会大于7。;;;;10.2.2 混合策略;;;用图形表示上述两组不等式的求解,如图10-3所示
;10.2.3 矩阵对策存在极小极大解的条件;; 是对策值,则称存在极小极大解,对应的第行,第 列的对策 或简写为 称为对策的最优解(或称最优纯策略)。注意,对策的解不一定唯一,即可能存在多于一个的 或 使(10-8)式成立。下面给出(10-8)式成立的条件。;;;定理1 零和矩阵对策有极小极大解的充要条件是:存在一个最优对策解 使
对一切 都成立。;;;;从而有;例10-1:给定矩阵对策的支付矩阵为; 由于各列中的极小为(5,-1,5,0),其中的最大值为5,故
又由于各行中的极大为(8,5,7,5),其中的最小值为5,故;显然有;10.3 连续对策;;;;;10.4 微分对策; 现在,微分对策已引起世界各国的广泛关注,特别是一些军事强国。在导弹拦截,电子战,火力配置等军事领域和商业竞争,招标与投标,资源开发与环境污染等经济和社会领域中,微分对策都可以发挥其作用。;10.4.1 微分对策的提法;;;;;;;;;;;;;;;;;;;上面所证明的双方极值原理是先假设存在最优策略所满足的鞍点条件(10-21),然后将鞍点条件拆成两个不等式(10-30)和(10-39),利用极小值原理和极大值原理得到两个最优解所满足的必要条件,再将它们结合起来得到极大极小解(最优策略)的必要条件。下面来讨论,在什么情况下这些必要条件也是充分条件。;10.4.2 最优策略的充分条件;;;;;;;;; 设追逐者的控制量是它的加速度 ,它垂直于指向逃逸者的初始视线。逃逸者的控制量为 它也垂直于初始视线。设 是垂直于初始视线的追—逃者之间的相对位置, 为其相对速度(见图10-5)。则相对运动的微分方程为;;;;;;;; 设A为拦截卫星,B为目标卫星。A欲控制自己,使在给定时间内尽可能接近B;B则控制自己,使在此时间内尽可能远离A。;式中, 是两卫星之间的相对距离在直角坐标系上的投影分量; 是卫星运行的角速率; 分别为作用在A、B卫星上的单位质量所受的推力幅值; 是 在直角坐标系中的两个方向角; 是;;;(10-82);;;;;;;10.5 线性二次微分对策;;;;;;;;;;;;;;;;;; 用导弹(追逐者)拦截空中目标(逃逸者)时,末制导段常用的经典导引律是比例导引。这里将用微分对策理论来推出比例导引律。;;;;;;;由(10-106)并利用(10-114)~(10-116),得;;;;(10-122);;;
原创力文档


文档评论(0)