第九章动态规划法.pptVIP

下载本文档

9
0
约8.39千字
约 45页
2018-04-20 发布于广东
举报
版权申诉

第九章动态规划法.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第九章动态规划法动态规划法是求解控制变量限制在一定闭集内的最优控制问题的又一种重要方法,它是由美国学者贝尔曼于1957 年提出来的。动态规划法把复杂的最优控制问题变成多级决策过程的递推函数关系,它的基础及核心是最优性原理。本章首先介绍动态规划法的基本概念,然后讨论如何用动态规划法求解离散及连续系统的最优控制问题。第一节动态规划法的基本概念一、多级决策过程所谓多级决策过程是指把一个过程分成若干级,而每一级都需作出决策,以便使整个过程达到最佳效果。为了说明这个概念,首先讨论一个最短路线问题的例子。A设有路线图如图7-1 所示。现在要从地出发,选择一条最短路 F B 、 C 、D 、E 线最终到达地,其间要通过等中间站,各站又有若干个可供选择的通过点,各地之间的距离已用数字标注在图中。由此可见,通过这些中间站时,有多个方案可供选择。解决这类问题有两种方法: 1. 探索法(穷举法)将至的所有可能的路线方案都列举出来,算出每条路线的路程, 进行比较,找出最短路线。直观可知,这种方法是很费时的,如本例共有38 条路线可供选择。如果中间站及各站可供选择的通过点都增为10 个,则可供选择的路线将急剧增至1010 条,显然计算工作量将急剧增加。 2. 分级决策法将整个过程分成若干级,逐级进行决策。具体过程如下:B B , B , B A将至 F 全程分为五级:第一级由 A 至;第二级由 B1 2 3 B , B , B? C C , C , C C C , C , C D D , D , D至 ;第三级由至? ;第四 1 2 3 1 2 3 1 2 3 1 2 3 E E , E D D , D , D? F? E E , E 级由至 ;第五级由至。让我们由后 1 2 1 2 3 1 2 F 向前逐级分析,先从第五级开始,其起点为 E E, E ,终点为。1 2 F F E , E F E至各只有一条路线,并无选择余地。至路程为1 , E至 1 2 1 2 E E , E 路程为2 。第四级起点为 DD, D, D ,终点为,其间有六条? 1 2 1 2 3 D F 路线,由至的各种可能路线为: DEF 4 ?15 1 1 DEF 224 1 2 DEF 6 ?17 2 1 DEF 9211 2 2 DEF 7 ?18 3 1 DEF 527 3 2D D DEF 可以发现,如果从出发,则走为最短,因此至 E 1 1 1 2 DE D 应选这段路线,称为决策。同理,如果从出发,应决策 1 2 2 D DE DE;从出发,应决策。可见作此决策时不能只从本 3 2 1 3 2 级路程长短出发,应考虑两级路程之和为最短。在整个路线问题 D ,D , D 中,究竟哪一点作为起点,则取决于第三级的决策,不 1 2 3 过提出的三条可能的最短路线为第三级的决策积累了数据资料。 C C , C , C? D 可见同样方法来分析第三级,其起点为 ,终点为 1 2 3 D , D , D D , D ,D ,按题意共有八条路线。但是, 至 F 的最短路 1 2 3 1 2 3 CDF 线已在第四级讨论中确定,因此的路线选择问题,实际 CD C 上只是选定级的路线问题(即本级决策问题)。因此,至 F 只有八条路线,分别为E 2 CDF 145 1 1 E 1 CDF 5712 1 2 E 2 CDF 8412 2 1 E 1 CDF 4711 2 2 E 2 CDF 6713 2 3 E 2 CDF 448 3 1 E 1 CDF 4711 3 2 E 2 CDF 279 3 3 C , C , C 比较可得分别从出发时的三条最短路线,它们为: 1 2 3 E 2 E E 1 2; ; 。 CDF ; 1 1 CDF CDF 2 2 3 1AB BC用同样方法,依次对级及级进行讨论,其结果列于表7-1 。最后得到最短路线为 ABCDEF 2 1 1 2 * 相应最短路程为: J 14。通过上例的讨论,可以看到多级决策过程具有以下特点: n ⑴ 把整个过程看成(或人为地分成) 级的多级过程。 ⑵ 采取逐级分析的方法,一般由最后一级开始倒向进行。 ⑶ 在每一级决策时,不只考虑本级的性能指标的最优,而是同时考虑本级及以后的总性能指标最优,因此它是根据“ 全局” 最优来作出本级决策的。 ⑷ 从数学观点,分级决策法与穷举法进行比较: 穷举法:全程五级线路,每一级都可任选,因此全部路程相当于一个“ 五变量函数” ,求全程最短实质上是求这个“ 五变量函数” 的极小值。分级决策法: 分成五级,从最后一级开始进行分级决策时,每级都是一个“ 单变量函数” ,因此进行