- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动态规划实例讲解ppt课件
第九章 动态规划(续);最优化原理 (贝尔曼最优化原理)
作为一个全过程的最优策略具有这样的性质:对于最优策略过程中的任意状态而言,无论其过去的状态和决策如何,余下的诸决策必构成一个最优子策略。该原理的具体解释是,若某一全过程最优策略为:;3.动态规划方法的基本步骤;3.动态规划方法的基本步骤;3.动态规划方法的基本步骤;3.动态规划方法的基本步骤; 6.写出动态规划函数基本方程
例如常见的指标函数是取各段指标和的形式
其中 表示第i阶段的指标,它显然是满足上述三个性质的。所以上式可以写成 :
; 学习方法建议:
第一步 先看问题,充分理解问题的条件、情况及求解目标。
第二步 结合前面讲到的理论和解题过程,考虑如何着手进行求解该问题的工作。分析针对该动态规划问题的“四大要素、一个方程”——这一步在开始时会感到困难,但是一定要下决心去思考,在思考过程中深入理解前文讲到的概念和理论。; 第三步 动手把求解思路整理出来,或者说,把该问题作为习题独立的来做。
第四步 把自己的求解放到一边,看书中的求解方法,要充分理解教材中的论述。
第五步 对照自己 的求解,分析成败。 ; 1.动态规划的四大要素
① 状态变量及其可能集合 xk ? Xk
② 决策变量及其允许集合 uk ? Uk
③ 状态转移方程 xk+1= Tk (xk ,uk )
④ 阶段效应 rk ( xk , uk )
; 2. 动态规划基本方程
fn+1(xn+1) = 0 (边界条件)
fk(xk) = opt u{rk ( xk , uk ) + fk+1(xk+1) }
k = n,…,1;求 最 短 路 径; 求 最 短 路 径例5.5; 将问题分成五个阶段,第k阶段到达的具体地点用状态变量xk表示,例如:x2=B3表示第二阶段到达位置B3,等等。这里状态变量取字符值而不是数值。;最优指标函数fk(xk)表示从目前状态到E的最短路径。终端条件为 f5(x5)=f5(E)=0其含义是从E到E的最短路径为0。;其中*表示最优值,在上表中,由于决策允许集合D4(x4)中的决策是唯一的,因此这个值就是最优值。;第三阶段的递推方程为:;由此得到f3(x3)的表达式:;求 最 短 路 径;由此得到f2(x2)的表达式:;第一阶段的递推方程为:;由此得到f1(x1)的表达式;资 源 分 配 问 题; 例5.6: 有资金4万元,投资A、B、C三个项目,每个项目的投资效益与投入该项目的资金有关。三个项目A、B、C的投资效益(万吨)和投入资金(万元)关系见下表:;阶段k:每投资一个项目作为一个阶段;
状态变量xk:投资第k个项目前的资金数;
决策变量dk:第k个项目的投资;
决策允许集合:0≤dk≤xk
状态转移方程:xk+1=xk-dk
阶段指标:vk(xk ,dk)见表中所示;
递推方程:fk(xk)=max{vk(xk ,dk)+fk+1(xk+1)}
终端条件:f4(x4)=0;k=4,f4(x4)=0k=3,0≤d3≤x3,x4=x3-d3;k=2,0≤d2≤x2,x3=x2-d2;k=1,0≤d1≤x1,x2=x1-d1;背 包 问 题;背 包 问 题;则 Max z= c1x1+c2x2+…+cnxn s.t. w1x1+w2x2+…+wnxn≤W x1,x2,…,xn为正整数 ;4. 决策允许集合:
Dk(xk)={dk|0? dk?xk/wk,dk为整数};
5. 状态转移方程:xk+1=xk-wkdk
6. 阶段指标:vk=ckdk
7. 递推方程
fk(xk)=max{ckdk+fk+1(xk+1)}
=max{ckdk+fk+1(xk-wkdk)}
8. 终端条件:fn+1(xn+1)=0; 例5.7:对于一个具体问题c1=65,c2=80,c3=30;w1=2,w2=3,w3=1;以及 W=5用动态规划求解 f4(x4)=0 对于k=3;对于k =3;对于k=2;对于k=1;; 机器负荷分配问题;; 构造动态规划模型如下: 阶段k:运行年份(k=1,2,3,4,5,6),其中k=1表示第一年初,…,依次类推;k=6表示第五年末(即第六年初)。 状态变量xk:第k年初完好的机器数(k=1,2,3,4,5,6),其中x6表
文档评论(0)