第8章 动态规划 Dynamic Programming 华国伟 北京交通大学物流管理系 内容提要 动态规划产生于20世纪50年代, 美国数学家贝尔曼(R. Bellman)等人提出. 动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种算法.必须对具体问题进行具体分析,运用动态规划的原理和方法,划分阶段,建立相应的模型,然后再去求解. 动态规划是用来解决多阶段决策过程最优化的一种数量方法.其特点在于,它可以把一个多阶段决策问题变换为几个相互联系的同类型单阶段最优化问题,从而一个一个地去解决. 1. 多阶段决策过程及实例 多阶段决策过程(序贯决策过程) 动态规划的基本概念 1. 阶段 2. 状态 3. 决策 4. 策略 5. 状态转移方程 6. 指标函数和最优值函数 练习 动态规划(逆序法)小结: 1.将问题的过程划分成恰当的阶段;对于静态问题要人为地赋予“时间”概念, 以便划分阶段. 2.选择状态变量 sk , 既能描述过程的变化又满足无后效性; 3.确定决策变量 uk 及每一阶段的允许决策集合Dk( sk ); 4.正确写出状态转移方程; 状态转移方程应当具有递推关系. 5.正确写出阶段指标函数和最优指标函数,建立动态规划基本方程 阶段指标函数是指第k 阶段的收益,最优指标函数是 指从第k
原创力文档

文档评论(0)