动态规划简介讲解.ppt

下载文档 降价啦

6
0
约小于1千字
约 10页
2017-01-25 发布于湖北
举报
版权申诉
保障服务

动态规划简介讲解.ppt

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

动态规划简介讲解

动态规划法简介多阶段决策过程最短路问题特点：若O-H-P-D是最短路，则H-P-D是从H到D的最短路。最短路求解过程动态规划法减少了计算量,丰富了计算结果动态规划的基本概念 1.阶段:反映问题时间或空间的自然特性k; 2.状态:表示在某阶段开始所处的自然状态或客观条件sk; 3.决策:可作出的选择dk,允许决策集合; 4.策略:决策序列(子策略); 过程:状态序列(子过程); 对状态要求具有无后效性,允许决策集合只与当时的状态有关; 5.状态转移方程:决策对下一阶段状态的影响sk+1 =Tk(sk ,dk); 收益或支出函数r=rk(sk ,dk); 6.最优值函数 fk(sk ); 递推方程 fk(sk )=opt{rk(sk ,dk)+fk+1(sk+1)}; 动态规划最优性原理 Bellman最优性原理：作为整个过程的最优策略具有这样的性质:无论过去的状态和决策如何，对前面的决策所形成的状态而言，余下的决策必定构成一个最优策略。换言之，最优策略的子策略总是最优的。同样，最优轨线的子轨线也是最优的。用动态规划方法解优化问题 1)将问题恰当的划分阶段； 2)状态变量的选择:能描述过程的演变，满足无后效性； 3)确定决策变量及允许决策集合； 4)写出状态转移方程和阶段效益式； 5)最优值函数:是定义在全过程和所有后部子过程的函数，具有可分离性，与原问题目标相关,写出递推方程及初始条件。例用动态规划方法求如下优化问题的最优解：例用动态规划方法求如下优化问题的最优解：分两步：逆推确定各状态的最优值函数及最优决策规则，顺推确定最优过程及最优策略。动态规划的主要缺点是所谓的“维数灾”。资源分配问题 * k sk dk sk+1 rk 例: 某公司拟将50万元资金投放下属A、B、C三个部门，各部门在获得资金后的收益如表所示，用动态规划方法求总收益最大的投资分配方案（投资数以10万元为单位）。 50 40 30 20 10 0 C 70 45 25 10 0 0 B 30 28 25 20 15 0 A 收益（万元） 50 40 30 20 10 0 投放资金（万元） *