最优化方法与最优控制9.docVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最优化方法与最优控制9

第七章 动态规划 系统的数学模型、目标函数和求解方法是最优化问题的三个要素。对于一个已知状态空间描述的控制系统来说,在确定了控制目标(性能指标)后,就需要寻求一个控制函数,使性能指标取最小(或最大)值。在控制界普遍认为,庞特里亚金(Понтрягин)的最小值原理和贝尔曼(Bellman)的动态规划是求解最优控制问题的两种有效方法。在第五章和第六章中,应用最小值原理给出了性能指标达到极值的必要条件,特别地,对于具有线性二次型性能指标的最优控制系统,能够得到最优控制的解析表达式,便于实现状态反馈控制。本章介绍动态规划的主要内容—最优性原理,它在处理多级决策过程是非常有效的。动态规划处理问题的思路是,把要处理的最优化问题转化为许多有序、相关的子问题,即多级决策过程,如果每一个子问题的解对全局都是最优的,那么,总的决策就是最优的。 本章先阐述多级决策过程的基本概念,其次介绍最优性原理,然后讨论用动态规划求解离散系统和连续系统的线性调节问题。 多级决策过程 所谓多级决策过程如图7-1所示。多级过程是由在时间或空间上(图7-2)顺序相关的若干级子过程组成的一个完整过程。在每一级都需要有相应的决策,对整个过程性能指标而言,该决策应当是最优的。显然某一级的决策确定后,必然会影响后一级过程的决策,从而影响到自当前一级过程到终端级过程的决策和整体性能指标。由于在某一级时,子过程的初始状态是由前面多级过程及其决策的结果,初始状态往往不是唯一的,即可供选择的决策往往不止一个。多级决策问题,就是要在允许选择的决策中选择一个最优的策略,使整体性能指标最优。 图7-1中的虚线框表示一级子过程,它可以代表任何类型的子过程。图7-1将线性离散系统展示成一个时间上的多级决策过程,每一级子过程的状态方程是 ,。 (7-1) 系统从状态经、、…转移到状态的过程称为级过程。当时,统称为多级过程。最优控制问题是,对于系统(7-1),寻求每一级的控制量,使性能指标 , (7-2) 最小。控制量(),称为最优决策,最优控制。 从图7-1不难看出,在过程处于级时,只要得到状态,级的决策就与前面的决策以及状态的演变过程无关,这种特性称为无后效性,这类过程称为马尔可夫(Morkov)过程。无后效性过程特点的另一种表述是,当前状态及其以后对系统施加的控制作用(包括级控制作用)决定着后续的状态转移过程。至于状态是如何转移来的,与后续的决策过程无直接关系,不必考虑。 动态规划的决策过程正是利用多级过程无后效性的特点,从最后一级开始进行最优决策,逐步倒推到最初一级。为使最后一级过程最优,需要选择最优决策。假设末级的初始状态已知,即不考虑是如何演变来的,选取就变得容易了。接着,选取倒数第二级的最优决策,逐步倒推到最初一级。当然,在作级决策时,后续级的最优决策已经得到,假设级初始状态已知,就能够根据状态确定级的最优决策,即是状态的函数。这样,每次选择最优决策时,只考虑多级决策中的一级,使复杂的决策选择简化了。下面用最优路线问题的示例来阐述动态规划问题的基本求解过程。 例7-1 最优路线问题。 可供选择线路如图7-2所示网络图,图中连线上的数字表示相邻两点间的距离。市政建设需要从起点A到终点P铺设一条管道,工程要求使用的管材最少,即选择一条从起点A到终点P的最短路径。这是一个典型的多级决策问题。 如果从起点A开始寻找最优决策,必须计算起点A到终点P的所有可供选择的路径长度,然后从中选取最短路径。图7-2中提供的路径总数是条,其中有许多计算是重复的,级数越多不必要的重复计算就越多,这种寻优算法很不科学。从最后一级开始寻优,则避免了重复计算,提高了寻优效率。图7-2中,下方的数字表示多级过程各级的顺序编号。 例7-1中,共有6级需要作决策选择。在末级,有两个出发点(初始状态),每个出发点都只有一条路径可选,记为 ,; 性能指标的下标表示该级在多级过程中的序号,括号中的字母表示该级的出发点。那么,倒推一级,得到 ; ; ; 在第4级共有3个出发点,每个出发点都有两条路径供选择,经过比较,选取最短路径。第一个表达式指出,若从K点出发,经N点到P点的路径短于另一条路径;另两个表达式分别指出如果从L点或M点出发,经O点到P点的路径最短。接着再倒推,直到起点A,由于表达式类同,不再重复叙述。在第3级,最优决策为 ;; ; 在第2级,最优决策为 ;; ; ; 在第1级,最优决策为 ;; 在第0级,最优决策为 ; 寻优过程到此结束,得知最短路径的总长度为。接着根据各级的决策,从起点A开始,逐级确定最优路径所经过的点,结论为 A→B→E→H→L→O→P。 对于本例,动态规划共作了29次加法运算、19次比较就得到了最短路径。如果采用穷举法寻找最短路径,就需要

文档评论(0)

liangyuehong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档