教案_动态规划1_1要点.pptVIP

  • 3
  • 0
  • 约6.87千字
  • 约 49页
  • 2017-02-08 发布于湖北
  • 举报
教案_动态规划1_1要点

第四节: 动态规划的理论基础和 具体迭代方 法 多阶段决策过程的特点:每个阶段都要进行决策,策略是由n个相继进行的决策构成的决策序列。前一阶段的终止状态又是下一阶段的初始状态,因此,确定阶段最优决策不能只从阶段的效应来考虑,必须是整个过程通盘考虑,整体规划。即阶段k的最优决策不应该只是本阶段效应的最优,而必须是本阶段及其所有后续阶段的总体最优。 动态规划方法的理论基础是基于R. Bellman提出的最优性原理:“一个过程的最优策略具有这样的性质:即无论其初始状态及初始决策如何,对于先前决策所形成的状态而言,余下的诸决策仍构成最优策略。” A M B 1 . 理论基础 适应于用动态规划方法求解的是具有无后效性的多阶段决策过程。 最优性原理的含义是:最优策略的任何一部分子策略,也是它相应初始状态的最优策略。每个最优策略只能由最优子策略构成。 动态规划的最优性定理:设阶段数为n的多阶段决策过程,其阶段编号为k=0,1,...,n-1。允许策略 是最优策略的充要条件是对任意一个k, 0kn-1和s0?S0,有 它是由给定的初始状态s0和子策略p0,k-1所确定的k段状态。当V是效益函数时,opt取max;当V是损失函数时,opt

文档评论(0)

1亿VIP精品文档

相关文档