运筹学14动态划2----.pptVIP

  • 1
  • 0
  • 约1.37千字
  • 约 12页
  • 2019-01-30 发布于江苏
  • 举报
运筹学14动态划2----

* 第五节:动态规划与静态规划之间的关系及其它相关总结 动态规划解法 逆序法 顺序法 静态规划 动态规划 线性规划 非线性规划 5.1 逆序(递推)法 设已知初始状态s1,最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。 具体方法如下: 当阶段k=n时 即 其中s表示状态,x表示决策(控制) 可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。 当阶段k=n-1时 其中状态转移方程 得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。 当阶段k=k时 其中状态转移方程 得最优决策xk=xk(sk)和最优值fk(sk)。 如此类推,直到第一阶段。 当阶段k=1时 其中状态转移方程 得最优决策x1=x1(s1)和最优值f1(s1)。 由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去,就可逐步确定出每阶段的决策及效益。 例1 用动态规划的逆序法求解下面问题 解: 分阶段:(按照问题的变量个数划分阶段)分三个阶段,即k=1,2,3。 确定决策变量:通常可以取问题中的变量为决策变量。 确定状态变量:状态变量与决策变量有密切关系,状态变量一般为累计量 或随递推过程变化的量。 指标函数 最优指标函数 fk(sk)=maxVk,3 状态转移方程 决策变量 边界条件 f4(s4)=1 基本方程 当阶段k=3时,有 当阶段k=2时,有 得最优决策 最优目标函数 有两个解,其中x2=0舍去。 因2阶导数在x*2处小于0,故有极大值。 当阶段k=1时,有 得最优决策 最优目标函数 因此最后可得: 与前面一样 用微分法。 s3=s2-x*2=s1- x*1- x*2 例2 某公司有资金10万元,若投资于项目i(i=1,2,3)的投资额为xi时,其效益分别为 ,问如何分配投资数额才能使总效益最大。 解:可列出静态规划问题的模型如下 分阶段:(考虑效益函数的形式)分三个阶段,即k=1,2,3。 确定决策变量:通常可以取静态规划中的变量为决策变量。 确定状态变量:状态变量与决策变量有密切关系,状态变量一般为累计量或随递推过程变化的量。 此问题中可设: 状态转移方程 决策 指标函数 最优指标函数fk(sk)=max Vk,3 基本方程 当阶段k=3时,有 最优决策为 最优目标函数 每一阶段可使用的资金数为状态变量sk * * *

文档评论(0)

1亿VIP精品文档

相关文档