- 4
- 0
- 约6.05千字
- 约 43页
- 2017-09-20 发布于江苏
- 举报
1动态规划1
练习:P211 习题8.2 5.1 逆序(递推)法 设已知初始状态s1,最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。 具体方法如下: 当阶段k=n时 即 其中s表示状态,x表示决策(控制) 可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。 当阶段k=n-1时 其中状态转移方程 得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。 当阶段k=k时 其中状态转移方程 得最优决策xk=xk(sk)和最优值fk(sk)。 如此类推,直到第一阶段。 当阶段k=1时 其中状态转移方程 得最优决策x1=x1(s1)和最优值f1(s1)。 由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去,就可逐步确定出每阶段的决策及效益。 例1 用动态规划的逆序法求解下面问题 * 动态规划(Dynamic Programming) 动态规划是美国数学家Bellman创立的。是解决复杂系统优化问题的一种方法。是解决动态系统多阶段决策过程的基本方法之一。 R Bellman50年代执教于普林斯顿和斯坦福大学,后进入兰德(Rand)研究所。1957年发表“Dynamic
您可能关注的文档
- -连续函数的运算-闭连性质.ppt
- -连续型随机变量及其分布密度.ppt
- -网络管理.ppt
- -连续型rv及概率密度.ppt
- -连续型随机变量.ppt
- -连续型随机变量及其分布律.ppt
- -连续型随机变量及其概率分布.ppt
- -连续型随机变量的概率密度.ppt
- -连续型随机变量的概率密度函数ppt.ppt
- -连续型随机变量及其概率密度().ppt
- 四川省凉山州西昌市达标名校2026届中考英语押题卷含答案.doc
- 江苏省南通市如皋区2026届中考语文全真模拟试题含解析.doc
- 安徽省六安市七校联考2026届中考历史模拟精编试卷含解析.doc
- 2026届新疆莎车县重点名校毕业升学考试模拟卷英语卷含答案.doc
- 甘肃省定西市安定区重点达标名校2026届中考猜题历史试卷含解析 (2).doc
- 重庆市长寿区2026届中考英语模拟预测试卷含答案.doc
- 2026届江苏省扬州市江都区江都实验中学中考历史猜题卷含解析.doc
- 2026届江苏省南京联合体【栖霞、江宁、雨花】重点达标名校中考语文押题卷含解析.doc
- 2026届江苏省扬州市江都区六校联考中考语文考前最后一卷含解析.doc
- 2026届安徽省合肥市庐阳中学中考四模英语试题含答案.doc
原创力文档

文档评论(0)