动态规划课件.pptxVIP

下载本文档

8
0
约2.37千字
约 70页
2023-11-07 发布于未知
举报
版权申诉

动态规划课件.pptx

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态规划 ; 动态规划是贝尔曼(Bellman)在五十年代为解决多级决策过程而提出来的。它可以解决很多领域中的问题，如生产过程的决策，收益和投资问题，有多级反应器的化工装置的设计，多级轧钢机的最速轧制问题，资源分配、机器负荷分配、生产计划编制，特别是控制工程问题。; 它和极小值原理一样，可解决控制变量受约束的最优控制问题，而且在这两种方法之间存在某种内在的联系。动态规划的中心思想是利用所谓“最优性原理”，把一个级决策过程化为个单级决策过程，从而使问题简单。;6.1 多级决策的例子——最短时间问题;;（一）穷举法 ; 路线行车时间（小时） 13 11 14 13 12 9; 这里每条路线由四段组成，也可以说是四级决策。为了计算每条路线所花时间，要做三次加法运算，为了计算六条路线所花的时间要作3×6=18次运算。这种方法称为“穷举法”。显然当段数很多时，计算量是很大的。这种方法的特点是从起点站往前进行，而且把这四级决策一起考虑。应注意从到下一站所花的时间为1，而到所花时间为3，但最优路线却不经过。这说明只看下一步的“眼前利益”来作决策是没有意义的。;（二）动态规划法 ;令为决策（控制）变量，它表示当处在位置而还有段要走时，所要选取的下一点。例如，从出发，下一点为时，则表示为。;;1 （倒数第一段） ;2（倒数第二段） ;;3（倒数第三段） ;;4（倒数第四段） ;;;;;6.2 最优性原理;;;;最优性原理可表示为 ;;;;6.3 用动态规划解资源分配问题;;;;容易看出，函数有下列性质 ;这些性质构成了以后解题的边界的条件。;;例1-1;;解由边界条件知。现在虑，它表示用1个单元资源分配到2个产品上的最大收益。表示投入第2个产品的资源，则可取值1或0，对应地将有下表。;;根据（6-10）式可得;同理，当可取值3，2，1，0时可求得; 再考虑3个产品的资源分配，可得这三个产品投入资源的单元数为1，2，3，4时的，最优值如下;;6.4 用动态规划求离散最优控制;寻找最优控制序列使最小，这正是多级决策问题，利用最优性原理，根据递推方程（6-2），从最后一步开始，逐步求出。下面用例子来说明求解过程。;例6-2 ;解先考虑最后一步，即从到。这时由（6-13）、（6-14）式得;将代入和可得，相应于上面最优控制的性能指标与最优状态转移为;求;;6.5 连续系统的动态规划; 设时间在区间内，则根据最优性原理，从到这一段过程应当是最优过程。把这段最优指标写成 ,则;现在，考虑系统从出发，到分两步走：先从到，再从到，是小量，则;;注意到，上式右边括号中表示最优指标，其中为最优控制，不需再选择，也与选择无关。故;引用以前使用过的哈密顿函数 ;（6-25）或（6-28）称为哈密顿—雅可比—贝尔曼方程，边界条件是（6-22）式。哈密顿—雅可比—贝尔曼方程在理论上很有价值，但它是的一阶偏微分方程并带有取极小的运算，因此求解是非常困难的，一般情况得不到解析解，只能用计算机求数值解。对于线性二次问题，可以得到解析解，而且求解结果与用极小值原理或变分法所得结果相同。这时，哈密顿——雅可比——贝尔曼方程