- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
八动态规划
第八章 动态规划 一、多阶段决策过程的最优化 二、基本概念和基本原理 三、动态规划模型的建立与求解 一、多阶段决策过程的最优化 一、多阶段决策过程的最优化 一、多阶段决策过程的最优化 一、多阶段决策过程的最优化 一、多阶段决策过程的最优化 一、多阶段决策过程的最优化 一、多阶段决策过程的最优化 二、基本概念和基本原理 二、基本概念和基本原理 二、基本概念和基本原理 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 三、动态规划模型的建立与求解 动态规划标号法较之穷举法的优点: 第一,容易算出; 其次,动态规划的计算结果不仅得到了从起始点到最终点的最短路线,而且得到了中间段任一点到最终点的最短路线 。 二、基本概念和基本原理 动态规划方法的基本思想: (1)将多阶段决策过程划分阶段,恰当地选取状态变量、决策变量及定义最优指标函数.从而把问题化成一族同类型的子问题,然后逐个求解。 (2)求解时从边界条件开始,逆(或顺)过程行进方向,逐段递推寻优。在每一个子问题求解时,都要使用它前面已求出的子问题的最优结果,最后一个子问题的最优解,就是整个问题的最优解。 (3)动态规划方法是既把当前一段与未来各段分开,又把当前效益和未来效益结合起来考虑的一种最优化方法,因此每段的最优决策选取是从全局考虑的,与该段的最优选择一般是不同的。 二、基本概念和基本原理 (一)逆序解法与顺序解法 (二)动态规划模型的建立 (三)基本方程分段求解时的几种常用算法 (一)逆序解法与顺序解法 如果寻优的方向与多阶段决策过程的实际行进方向相反,从最后一段开始计算逐段前推,求得全过程的最优策略,称为逆序解法。 顺序解法的寻优方向同于过程的行进方向,计算时从第一段开始逐段向后递推,计算后一阶段要用到前一阶段的求优结果,最后一段计算的结果就是全过程的最优结果。 第一步:k=0 状态:s1=A f0(A)=0 求解步骤 第二步:k=1 状态:B1 B2 u1*(B1)=A u1*(B2)=A f1(B1)=4 f2(B2)=5 (4) (5) 第三步:k=2 状态:C1 C2 C3 C4 u2*(C1)=B1 u2*(C2)=B1 u2*(C3)=B1 f2(C1)=6 f2(C2)=7 f2(C3)=10 u2*(C4)=B2 f2(C4)=12 (4) (5) (6) (7) (10) (12) (4) (5) (6) (7) (10) (12) 第四步:k=3 状态:D1 D2 D3 u3*(D1)=C1或C2 u3*(D2)=C2 u3*(D3)=C3 f3(D1)=11 f3(D2)=12 f3(D3)=14 (11) (12) (14) 第五步:k=4 状态:E1 E2 u4*(E1)=D1 u4*(E2)=D2 f4(E1)=14 f4(E2)=14 (4) (5) (6) (7) (10) (12) (11) (12) (14) (14) (14) 第六步:k=5 状态:F u5*(F)=E2 f5(F)=17 (6) (4) (5) (7) (10) (12) (11) (12) (14) (14) (14) (17) 即从A到F的最短距离为17。 最优路线为:A-B1-C2-D2-E2-F 逆序解法与顺序解法建模的不同点 1.状态转移方式不同 sk+1=Tk(sk,uk) sk=Tk(sk+1,uk) 1 状态s1 决策u1 效益v1(s1,u1) s2 k sk uk vk(sk,uk) Sk+1 n sn un vn(sn,un) Sn+1 1 状态s1 决策u1 效益v1(s2,u1) s2 k sk uk vk(sk+1,uk) Sk
文档评论(0)