第5章节动态规划.pptVIP

下载本文档

7
0
约1.51万字
约 70页
2017-09-15 发布于浙江
举报
版权申诉

第5章节动态规划.ppt

1、本文档共70页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第5章节动态规划

第五章动态规划(DP) §1　多阶段决策过程最优化问题 §2　动态规划的基本概念、基本思想 §3　动态规划的基本方法 §4　动态规划的应用多阶段决策过程最优化问题一、动态规划分支简介 1951年，美国运筹学家Belman(贝尔曼)提出了解决多阶段决策问题的“最优化原理”，1957年贝尔曼的专著《动态规划》一书问世，标志着这一分支的诞生。动态规划是解决多阶段决策问题的最优化方法。多阶段决策过程最优化问题动态规划是求解多阶段决策问题的一种方法，是考察问题的一种途径，它没有统一的数学模型和算法，必须对具体问题进行具体分析，针对不同的问题，运用动态规划的原理和方法，建立起相应的模型，然后再用动态规划方法去求解。多阶段决策过程最优化问题二、多阶段决策过程最优化问题基本特征 1. 阶段性。决策的全过程可依据时间或空间顺序划分相互联系的若干阶段。每一阶段即为一个子问题。这样就将原问题的求解转化为逐个求解几个单阶段子问题。 2. 每个阶段都要做出决策，当求解了每一阶段的子问题后，整个决策过程也随之确定。　多阶段决策过程最优化问题例：最短路径问题求A到E的最短路径。　基本概念、基本思想 3、决策：当过程处于某个阶段的某个状态时，从该状态向下一状态过渡时所做的选择。用决策变量xk(sk)来描述。例： x2(B1)={c1, c2, c3}(表示处于第2阶段B1状态时，向第3阶段过渡时可能的选择有 c1, c2或 c3 。若 x2(B1)=c1 ，则表示处于第2阶段B1状态时，向第3阶段过渡时选择了c1，即选择了路径：　基本概念、基本思想 4、策略：一个按顺序排列的决策组成的集合。记为 Pk,n(sk) （假设多阶段问题的整个过程划分为n个阶段。）若k=1,即P1,n(s1)即为全过程策略。 P1,n(s1)={x1(s1), x2(s2) …，xn(sn)} 若k＞1，则表示从第k阶段开始到最后第n阶段的决策序列，称k子过程策略。 Pk,n(sk)={xk(sk), xk+1(sk+1) …，xn(sn)} 基本概念、基本思想 5.指标函数衡量全过程策略或k子过程策略决策效果的优劣的数量指标。阶段指标vk 衡量每一阶段决策效果的优劣的数量指标。第k阶段sk状态下作出xk(sk),决策的指标值。记作：vk (sk, xk(sk), ) 最优指标函数衡量全过程策略或子过程策略最优指标函数。记作： fk(sk)。当K=1时，f1(s1)为全过程上的最优指标函数；当K＞1时, fk(sk)为K子过程上的最优指标函数。基本概念、基本思想 6.状态转移方程表示从某状态出发到下一阶段某状态的转移规律。记作： Sk+1=T(sk, xk(sk)) 第k+1阶段的状态是由第k阶段的状态和决策决定的。例如：S3=T (B2, C1) = C1 　基本概念、基本思想例如最短路问题重要性质：对最短路问题来说，从最短路上的任一点到终点的部分道路（最短路上的子路）也一定是从该点到终点的最短路（最短子路）。　基本概念、基本思想证明：假设A P H E是一条最短路线，则P H E必定是从P点出发到终点E的所有可选择的子路线中最短的路线。　基本概念、基本思想 2. 逆序算法根据最优化原理，逆序寻优，各阶段求解都是在后部子过程策略基础上，计算本阶段最优策略，直至求解到第一阶段，也就求得了整个过程上的最优决策方案。基本概念、基本思想举例：最短路问题的逆序算法（逆推法和顺推法）。从最后一段开始，用由后向前逐步递推的方法，求出各点到终点最短路线。当递推到第1阶段，也就求出了整个过程即从起点到终点的最短路线。若寻优方向与行进方向（阶段顺序）正好相逆，则称为逆推法。反之，称为顺推法。基本概念、基本思想 3. 动态规划的基本方程递推公式： fk(sk)=OPT{vk(sk,xk)+fk+1(sk+1)}(k=n,n-1, …,2,1) 终点条件： fn+1(sn+1)=0 举例：最短路问题 fk(sk)：第k阶段从状态sk到终点的最短距离； vk(sk,xk)：第k阶段从状态sk到xk的距离。　动态规划的基本方法逆序算法求解例：最短路问题：　动

您可能关注的文档

文档评论（0）

ctuorn0371 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第5章节动态规划.pptVIP