- 1、本文档共130页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
的任意性最优控制第101页,共130页,星期六,2024年,5月最优轨线方程最优性能指标第102页,共130页,星期六,2024年,5月例4.3,性能指标第103页,共130页,星期六,2024年,5月最优控制第104页,共130页,星期六,2024年,5月,,最优控制极限解第105页,共130页,星期六,2024年,5月闭环控制系统结构第106页,共130页,星期六,2024年,5月两种方法庞特里雅金前苏联学者极大值原理贝尔曼美国学者动态规划应用在过程控制、国防建设、经济规划、管理多个分支分布参数的最优控制、随机最优控制、大系统最优控制以及多方多层次的微分对策和主从对策等第107页,共130页,星期六,2024年,5月第五章动态规划
动态规划是求解最优控制的又一种方法,特别对离散型控制系统更为有效,而且得出的是综合控制函数。这种方法来源于多决策过程,并由贝尔曼首先提出,故称贝尔曼动态规划。第108页,共130页,星期六,2024年,5月5.1多级决策过程与最优性原理作为例子,首先分析最优路径问题(a)(b)(c)试分析(a),(b)和(c)三种情况的最优路径,即从走到所需时间最少。规定沿水平方向只能前进不能后退。第109页,共130页,星期六,2024年,5月(a)中只有两条路径,从起点开始,一旦选定路线,就直达终点,选最优路径就是从两条中选一条,使路程所用时间最少。这很容易办到,只稍加计算,便可知道,上面一条所需时间最少。(b)共有6条路径可到达终点,若仍用上面方法,需计算6次,将每条路线所需时间求出,然后比较,找出一条时间最短的路程。(c)需计算20次,因为这时有20条路径,由此可见,计算量显著增大了。第110页,共130页,星期六,2024年,5月逆向分级计算法逆向是指计算从后面开始,分级是指逐级计算。逆向分级就是从后向前逐级计算。以(c)为例从倒数第一级开始,状态有两个,分别为和在处,只有一条路到达终点,其时间是;在处,也只有一条,时间为1。后一条时间最短,将此时间相应地标在点上。并将此点到终点的最优路径画上箭头。第111页,共130页,星期六,2024年,5月然后再考虑第二级只有一种选择,到终点所需时间是有两条路,比较后选出时间最少的一条,即4+1=5。用箭头标出也标出最优路径和时间依此类推,最后计算初始位置求得最优路径最短时间为13第112页,共130页,星期六,2024年,5月最优路径示意图第113页,共130页,星期六,2024年,5月多级过程多级决策过程目标函数控制目的选择决策序列使目标函数取最小值或最大值实际上就是离散状态的最优控制问题第114页,共130页,星期六,2024年,5月最优性原理在一个多级决策问题中的最优决策具有这样的性质,不管初始级、初始状态和初始决策是什么,当把其中任何一级和状态做为初始级和初始状态时,余下的决策对此仍是最优决策。第115页,共130页,星期六,2024年,5月指标函数多是各级指标之和,即具有可加性最优性原理的数学表达式第116页,共130页,星期六,2024年,5月5.2离散系统动态规划阶离散系统性能指标求决策向量使有最小值(或最大值),其终点可自由,也可固定或受约束。第117页,共130页,星期六,2024年,5月引进记号应用最优性原理可建立如下递推公式贝尔曼动态规划方程第118页,共130页,星期六,2024年,5月例5.2设一阶离散系统,状态方程和初始条件为性能指标求使有最小值的最优决策序列和最优轨线序列指标可写为第119页,共130页,星期六,2024年,5月代入上一级第120页,共130页,星期六,2024年,5月代入状态方程最优决策序列最优轨线第121页,共130页,星期六,2024年,5月5.3连续系统的动态规划性能指标目标集引进记号根据最优性原理及第122页,共130页,星期六,2024年,5月第123页,共130页,星期六,2024年,5月由泰勒公式,得由中值定理,得第124页,共130页,星期六,2024年,5月3.4.1快速控制问题性能指标时间上限是可变的从状态转移平衡
文档评论(0)