1动态规划1.pptVIP

下载本文档

4
0
约6.05千字
约 43页
2017-09-20 发布于江苏
举报

1动态规划1.ppt

1动态规划1

练习：P211 习题8.2 5.1 逆序（递推）法设已知初始状态s1，最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。具体方法如下：当阶段k=n时即其中s表示状态，x表示决策（控制）可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。当阶段k=n-1时其中状态转移方程得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。当阶段k=k时其中状态转移方程得最优决策xk=xk(sk)和最优值fk(sk)。如此类推，直到第一阶段。当阶段k=1时其中状态转移方程得最优决策x1=x1(s1)和最优值f1(s1)。由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去，就可逐步确定出每阶段的决策及效益。例1 用动态规划的逆序法求解下面问题 * 动态规划（Dynamic Programming）动态规划是美国数学家Bellman创立的。是解决复杂系统优化问题的一种方法。是解决动态系统多阶段决策过程的基本方法之一。 R Bellman50年代执教于普林斯顿和斯坦福大学，后进入兰德（Rand）研究所。1957年发表“Dynamic

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

1动态规划1.pptVIP