动态规划-西南科技大学.pptVIP

  • 46
  • 0
  • 约5.3千字
  • 约 42页
  • 2016-08-17 发布于海南
  • 举报
动态规划-西南科技大学

然后,进入第n-1阶段,则最大效益为 其中 。解此一维极值问题, 得到最优解 ,就是当第n-1阶段的输入为 时的最优决策。 如此类推,直到第一阶段,得到最大效益为 其中 ,解之,得到最优解 在上述逆推过程中,我们逐步求出了极值函数 及相应决策函数 由于初始状态 是已知的,按照上述递推过程相反的顺序推算,就可逐步确定出每一阶段的决策及效益。 综上所述,整个过程包括两个步骤,前一步骤称为“迭代”或“递推”,后一步骤称为“回代”。 例: 求 在满足约束条件 之下,使函数 达到最大值。 这个例子可有用初等方法或微分学方法求出它的最优解,现在用动态规划方法来求解。按变量划分阶段,可把它看作一个三阶段决策问题,决策变量分别为 设初始状态 ,状态转移函数为 ,各阶段的效益 按乘法结合起来, * 西南科技大学网络教育 第7讲 动态规划 数学建模与数学实验 西南科技大学理学院数学系 主讲教师: 彭煜 杨学南 西南科技大学网络教育系列课程 第7章 动态规划 动态规划是解决多阶段决策过程最优化问题的一种数学方法.动态规划在工程技术、管理、经济、工业生产、军事及现代控制工程等方面都有广泛的应用,而且由于动态规划方法有其独特之处,在解决某些实际问题时,显得更加方便有

文档评论(0)

1亿VIP精品文档

相关文档