运筹学14动态规划2.....pptVIP

下载本文档

11
0
约1.37千字
约 12页
2019-03-13 发布于江苏
举报

运筹学14动态规划2.....ppt

* 第五节：动态规划与静态规划之间的关系及其它相关总结动态规划解法逆序法顺序法静态规划动态规划线性规划非线性规划 5.1 逆序（递推）法设已知初始状态s1，最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。具体方法如下：当阶段k=n时即其中s表示状态，x表示决策（控制）可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。当阶段k=n-1时其中状态转移方程得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。当阶段k=k时其中状态转移方程得最优决策xk=xk(sk)和最优值fk(sk)。如此类推，直到第一阶段。当阶段k=1时其中状态转移方程得最优决策x1=x1(s1)和最优值f1(s1)。由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去，就可逐步确定出每阶段的决策及效益。例1 用动态规划的逆序法求解下面问题解：分阶段：（按照问题的变量个数划分阶段）分三个阶段，即k=1，2，3。确定决策变量：通常可以取问题中的变量为决策变量。确定状态变量：状态变量与决策变量有密切关系，状态变量一般为累计量或随递推过程变化的量。指标函数最优指标函数 fk(sk)=maxVk,3 状态转移方程决策变量边界条件 f4(s4)=1 基本方程当阶段k=3时，有当阶段k=2时，有得最优决策最优目标函数有两个解，其中x2=0舍去。因2阶导数在x*2处小于0，故有极大值。当阶段k=1时，有得最优决策最优目标函数因此最后可得：与前面一样用微分法。 s3=s2-x*2=s1- x*1- x*2 例2 某公司有资金10万元，若投资于项目i（i=1，2，3）的投资额为xi时，其效益分别为，问如何分配投资数额才能使总效益最大。解：可列出静态规划问题的模型如下分阶段：（考虑效益函数的形式）分三个阶段，即k=1，2，3。确定决策变量：通常可以取静态规划中的变量为决策变量。确定状态变量：状态变量与决策变量有密切关系，状态变量一般为累计量或随递推过程变化的量。此问题中可设：状态转移方程决策指标函数最优指标函数fk(sk)=max Vk,3 基本方程当阶段k=3时，有最优决策为最优目标函数每一阶段可使用的资金数为状态变量sk * * *

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

运筹学14动态规划2.....pptVIP