练习:P211 习题8.2 5.1 逆序(递推)法 设已知初始状态s1,最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。 具体方法如下: 当阶段k=n时 即 其中s表示状态,x表示决策(控制) 可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。 当阶段k=n-1时 其中状态转移方程 得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。 当阶段k=k时 其中状态转移方程 得最优决策xk=xk(sk)和最优值fk(sk)。 如此类推,直到第一阶段。 当阶段k=1时 其中状态转移方程 得最优决策x1=x1(s1)和最优值f1(s1)。 由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去,就可逐步确定出每阶段的决策及效益。 例1 用动态规划的逆序法求解下面问题 * 动态规划(Dynamic Programming) 动态规划是美国数学家Bellman创立的。是解决复杂系统优化问题的一种方法。是解决动态系统多阶段决策过程的基本方法之一。 R Bellman50年代执教于普林斯顿和斯坦福大学,后进入兰德(Rand)研究所。1957年发表“Dynamic
您可能关注的文档
最近下载
- GB46768-2025《有限空间作业安全技术规范》解读_-60页.pptx
- 《首饰 指环尺寸 定义、测量和命名》标准修订发展报告.docx VIP
- 首饰 指环尺寸 定义、测量和命名标准立项修订与发展报告.docx VIP
- 仪器设备维护与保养培训.pptx VIP
- 《建筑设计防火规范》GB50016-2014.pptx VIP
- 注水系统效率计算.ppt
- XT-20自动过分相地面磁感应传感器专用测量仪使用说明书2011.pdf VIP
- 《计算机系统结构》 第二版课后答案(张晨曦 ).pdf VIP
- 新解读《GB_T 11888 - 2021首饰 指环尺寸 定义、测量和命名》最新解读.pptx VIP
- (正式版)DB37∕T 2950-2017 《首饰手镯尺寸定义、测量和命名》.docx VIP
原创力文档

文档评论(0)