思路整理出来,或者说,把该问题作为习题独立的来做。第四步把自己的求解放到一边,看书中的求解方法,要充分理解教材中的论述。第五步对照自己的求解,分析成败。4.动态规划方法应用举例精品1.动态规划的四大要素①状态变量及其可能集合xk?Xk②决策变量及其允许集合uk?Uk③状态转移方程xk+1=Tk(xk,uk)④阶段效应rk(xk,uk)4.动态规划方法应用举例精品2.动态规划基本方程fn+1(xn+1)=0(边界条件
递推方程:fk(xk)=max{vk(xk,dk)+fk+1(xk+1)} dk?Dk(xk)= max{8dk+5(xk- dk)+fk+1[0.7dk+0.9(xk-dk)]} 0?dk?xk 机器负荷分配问题 精品 第三步 动手把求解思路整理出来,或者说,把该问题作为习题独立的来做。 第四步 把自己的求解放到一边,看书中的求解方法,要充分理解教材中的论述。 第五步 对照自己 的求解,分析成败。 4.动态规划方法应用举例 精品 1.动态规划的四大要素 ① 状态变量及其可能集合 xk ? Xk ② 决策变量及其允许集合 uk ? Uk ③ 状态转移方程 xk+1= Tk (xk ,uk ) ④ 阶段效应 rk ( xk , uk ) 4.动态规划方法应用举例 精品 2. 动态规划基本方程 fn+1(xn+1) = 0 (边界条件) fk(xk) = opt u{rk ( xk , uk ) + fk+1(xk+1) } k = n , n-1, … , 1 4.动态规划方法应用举例 精品 求 最 短 路 径 精品 求 最 短 路 径例5.5 精品 将问题分成五个阶段,第k阶段到达的具体地点用状态变量xk表示,例如:x2=B3表示第二阶段到达位置B3,等等。这里状态变量取字符值而不是数值。 将决策定义为到达下一站所选择的路径,例如目前的状态是x2=B3,这时决策允许集合包含三个决策,它们是D2(x2)=D2(B3)={B3?C1,B3?C2,B3?C3} 求 最 短 路 径 精品 最优指标函数fk(xk)表示从目前状态到E的最短路径。终端条件为 f5(x5)=f5(E)=0其含义是从E到E的最短路径为0。 第四阶段的递推方程为 : 求 最 短 路 径 精品 其中*表示最优值,在上表中,由于决策允许集合D4(x4)中的决策是唯一的,因此这个值就是最优值。 由此得到f4(x4)的表达式。由于这是一个离散的函数,取值用列表表示: 求 最 短 路 径 精品 第三阶段的递推方程为: 求 最 短 路 径 精品 由此得到f3(x3)的表达式: 求 最 短 路 径 精品 求 最 短 路 径 精品 由此得到f2(x2)的表达式: 求 最 短 路 径 精品 第一阶段的递推方程为: 求 最 短 路 径 精品 由此得到f1(x1)的表达式 求 最 短 路 径 精品 资 源 分 配 问 题 精品 例5.6: 有资金4万元,投资A、B、C三个项目,每个项目的投资效益与投入该项目的资金有关。三个项目A、B、C的投资效益(万吨)和投入资金(万元)关系见下表: 求对三个项目的最优投资分配,使总投资效益最大。 资 源 分 配 问 题 精品 阶段k:每投资一个项目作为一个阶段; 状态变量xk:投资第k个项目前的资金数; 决策变量dk:第k个项目的投资; 决策允许集合:0≤dk≤xk 状态转移方程:xk+1=xk-dk 阶段指标:vk(xk ,dk)见表中所示; 递推方程:fk(xk)=max{vk(xk ,dk)+fk+1(xk+1)} 终端条件:f4(x4)=0 资 源 分 配 问 题 精品 k=4,f4(x4)=0k=3,0≤d3≤x3,x4=x3-d3 资 源 分 配 问 题 精品 k=2,0≤d2≤x2,x3=x2-d2 资 源 分 配 问 题 精品 k=1,0≤d1≤x1,x2=x1-d1 资 源 分 配 问 题 精品 背 包 问 题 精品 背 包 问 题 精品 则 Max z= c1x1+c2x2+…+cnxn s.t. w1x1+w2x2+…+wnxn≤W x1,x2,…,xn为正整数 阶段k:第k次装载第k种物品(k=1,2,…,n) 状态变量xk:第k次装载时背包还可以装载的重量; 决策变量dk:第k次装载第k种物品的件数; 背 包 问 题 精品 4. 决策允许集合: Dk(xk)={dk|0? dk?xk/wk,dk为整数}; 5. 状态转移方程:xk+1=xk-wkdk 6. 阶段指标:vk=ckdk 7. 递推方程 fk(xk)=max{ckdk+fk+1(xk+1)} =max{ckdk+fk+1(xk-wkdk)} 8. 终端条件:fn+1(xn+1)=0 背 包 问 题 精品 例5.7:对于一个具体问题c1
原创力文档

文档评论(0)