现代控制理论_第9章_动态规划法.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
现代控制理论_第9章_动态规划法

假设二次型问题的最优性能指标为状态的二次函数: (9-20) 上式对 成立,代入式(9-19)得: (9-21) 将系统状态方程代入,得: (9-22) * 第九章 动态规划法 动态规划法是求解控制变量限制在一定闭集内的最优控制问题的又一种重要方法,它是由美国学者贝尔曼于1957年提出来的。动态规划法把复杂的最优控制问题变成多级决策过程的递推函数关系,它的基础及核心是最优性原理。本章首先介绍动态规划法的基本概念,然后讨论如何用动态规划法求解离散及连续系统的最优控制问题。 第一节 动态规划法的基本概念 一、多级决策过程 所谓多级决策过程是指把一个过程分成若干级,而每一级都需作出决策,以便使整个过程达到最佳效果。为了说明这个概念,首先讨论一个最短路线问题的例子。 设有路线图如图7-1所示。现在要从 地出发,选择一条最短路线最终到达 地,其间要通过 等中间站,各站又有若干个可供选择的通过点,各地之间的距离已用数字标注在图中。由此可见,通过这些中间站时,有多个方案可供选择。 解决这类问题有两种方法: 探索法(穷举法) 将至的所有可能的路线方案都列举出来,算出每条路线的路程,进行比较,找出最短路线。直观可知,这种方法是很费时的,如本例共有38条路线可供选择。如果中间站及各站可供选择的通过点都增为10个,则可供选择的路线将急剧增至1010条,显然计算工作量将急剧增加。 分级决策法 将整个过程分成若干级,逐级进行决策。具体过程如下: 将 至 全程分为五级:第一级由 至 ;第二级由 至 ;第三级由 至 ;第四级由 至 ;第五级由 至 。让我们由后向前逐级分析,先从第五级开始,其起点为 ,终点为 。 至 各只有一条路线,并无选择余地。 至 路程为1, 至 路程为2。第四级起点为 ,终点为 ,其间有六条路线,由 至 的各种可能路线为: 可以发现,如果从 出发,则走 为最短,因此 至 应选 这段路线,称为决策。同理,如果从 出发,应决策 ;从 出发,应决策 。可见作此决策时不能只从本级路程长短出发,应考虑两级路程之和为最短。在整个路线问题中,究竟 哪一点作为起点,则取决于第三级的决策,不过提出的三条可能的最短路线为第三级的决策积累了数据资料。 可见同样方法来分析第三级,其起点为 ,终点为 ,按题意共有八条路线。但是, 至 的最短路线已在第四级讨论中确定,因此 的路线选择问题,实际上只是选定级 的路线问题(即本级决策问题)。因此, 至 只有八条路线,分别为 比较可得分别从 出发时的三条最短路线,它们为: ; ; 。 用同样方法,依次对 级及 级进行讨论,其结果列于表7-1。最后得到最短路线为 相应最短路程为: 。 通过上例的讨论,可以看到多级决策过程具有以下特点: ⑴ 把整个过程看成(或人为地分成) 级的多级过程。 ⑵ 采取逐级分析的方法,一般由最后一级开始倒向进行。 ⑶ 在每一级决策时,不只考虑本级的性能指标的最优,而是同时考虑本级及以后的总性能指标最优,因此它是根据“全局”最优来作出本级决策的。 ⑷ 从数学观点,分级决策法与穷举法进行比较: 穷举法:全程五级线路,每一级都可任选,因此全部路程相当于一个“五变量函数”,求全程最短实质上是求这个“五变量函数”的极小值。 分级决策法: 分成五级,从最后一级开始进行分级决策时,每级都是一个“单变量函数”,因此进行每一级决策时,实际上是求一个“单变量函数”的极小值。因此多级决策法把一个求“五变量函数”的极值问题转化成为一个五组求“单变量函数”的极值问题。这组实

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档