最优控制-西安交通大学课件lecture9.pptVIP

下载本文档

6
0
约3.05千字
约 33页
2019-08-11 发布于四川
举报
版权申诉

最优控制-西安交通大学课件lecture9.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * * * 高峰、吴江 * 最优性原理一个多段决策过程的最优决策具有如下性质：不论现在的状态和过去的决策如何，随后各阶段的决策对于现在的状态必定构成最优控制。 Bellman方程高峰、吴江 * 动态规划的连续形式（Hamilton-Jacobi-Bellman方程）高峰、吴江 * 思考的问题最优控制的经典内容已经结束，考虑一下对最优控制理论与方法的理解。是否可以演绎出最优控制理论与方法的体系？依从于什么样的线索？如果能做到这一点，最优控制就真的变成你自己的了。你的大脑改变了! * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 高峰、吴江 SEI 最优控制2013 动态规划高峰、吴江 2013/06/09 高峰、吴江 * 提纲最大值原理回顾多段决策过程动态规划与Bellman方程动态规划计算方法动态规划求解LQR问题动态规划的连续形式小结高峰、吴江 * 控制向量有界情形甚至H对u不可导经典变分法无法解决高峰、吴江 * 最小值原理 Hamilton函数在最优轨线上取得最小值。耦合方程 =〉极值条件转化为两点边值问题同样是非常困难的问题高峰、吴江 * 一类特殊的最优控制问题泛函求极值线性控制项控制各分量上下界高峰、吴江 * Bang-Bang控制在某些情形下，可求得状态相平面上的开关线或开关面，由此构成反馈控制结构。高峰、吴江 * 提纲最大值原理回顾多段决策过程动态规划与Bellman方程动态规划计算方法动态规划求解LQR问题动态规划的连续形式小结高峰、吴江 * Richard Bellman (1920～1984)　　美国数学家，美国全国科学院院士，动态规划的创始人。1920年8月26日生于美国纽约。1984年3月19日逝世。1941年在布鲁克林学院毕业，获理学士学位，1943年在威斯康星大学获理学硕士学位，1946年在普林斯顿大学获博士学位。1946～1948年在普林斯顿大学任助理教授,1948～1952年在斯坦福大学任副教授,1953～1956年在美国兰德公司任研究员，1956年后在南加利福尼亚大学任数学教授、电气工程教授和医学教授。　　贝尔曼因提出动态规划而获美国数学会和美国工程数学与应用数学会联合颁发的第一届维纳奖金（1970），卡内基－梅隆大学颁发的第一届迪克森奖金(1970)，美国管理科学研究会和美国运筹学会联合颁发的诺伊曼理论奖金(1976)。1977年贝尔曼当选为美国艺术与科学研究院院士和美国工程科学院院士。　　贝尔曼因在研究多段决策过程中提出动态规划而闻名于世。1957年他的专著《动态规划》出版后，被迅速译成俄文、日文、德文和法文，对控制理论界和数学界有深远影响。贝尔曼还把不变嵌入原理应用于理论物理和数学分析方面，把两点边值问题化为初值问题，简化了问题的分析和求解过程。1955年后贝尔曼开始研究算法、计算机仿真和人工智能，把建模与仿真等数学方法应用到工程、经济、社会和医学等方面，取得许多成就。贝尔曼对稳定性的矩阵理论、时滞系统、自适应控制过程、分岔理论、微分和积分不等式等方面都有过贡献。　　贝尔曼曾是《数学分析与应用杂志》及《数学生物科学杂志》的主编，《科学与工程中的数学》丛书的主编。已出版30本著作和7本专著，发表了600多篇研究论文。高峰、吴江 * 从另一角度看泛函求极值问题这种离散泛函求极值问题称为多段决策过程高峰、吴江 * 加性可分目标函数可分本段的目标f(x(k),u(k),k)，只决定于本段的段变量k ，本段的控制u(k)，本段的状态x(k) 。加性总目标为各段目标之和。高峰、吴江 * 提纲最大值原理回顾多段决策过程动态规划与Bellman方程动态规划计算方法动态规划求解LQR问题动态规划的连续形式小结高峰、吴江 * 动态规划举例汽车从S站出发，到T站终止，全程分为4段，如何选择路线使S-T时间最短？（图中数字为各段所需时间。） S T B A D C F E 4 5 4 6 6 7 1 1 2 2 4 3 高峰、吴江 * 第三阶段决策：E or F T D F E 2 2 4 3 T C F E 1 1 4 3 最优：C-F-T (4) 最优：D-F-T (5) 高峰、吴江 * 第二阶段决策：C or D 7 T B D C 4 4 5 T A D C 6 6 4 5 最优：A-C??????T (10) 最优：B-C??????T (8) 高峰、吴江 * 第一阶段决策：A or B T S B A 4 5 10 8 最优：S-B??????T (13) 最优决策：S-B-C-F-T （13） S