- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
动态规划简介讲解
动态规划法简介 多阶段决策过程 最短路问题 特点:若O-H-P-D是最短路,则H-P-D是从H到D的最短路。 最短路求解过程 动态规划法减少了计算量,丰富了计算结果 动态规划的基本概念 1.阶段:反映问题时间或空间的自然特性k; 2.状态:表示在某阶段开始所处的自然状态或客观条件sk; 3.决策:可作出的选择dk,允许决策集合; 4.策略:决策序列(子策略); 过程:状态序列(子过程); 对状态要求具有无后效性,允许决策集合只与当时的状态有关; 5.状态转移方程:决策对下一阶段状态的影响sk+1 =Tk(sk ,dk); 收益或支出函数r=rk(sk ,dk); 6.最优值函数 fk(sk ); 递推方程 fk(sk )=opt{rk(sk ,dk)+fk+1(sk+1)}; 动态规划最优性原理 Bellman最优性原理:作为整个过程的最优策略具有这样的性质:无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的决策必定构成一个最优策略。 换言之,最优策略的子策略总是最优的。 同样,最优轨线的子轨线也是最优的。 用动态规划方法解优化问题 1)将问题恰当的划分阶段; 2)状态变量的选择:能描述过程的演变,满足无后效性; 3)确定决策变量及允许决策集合; 4)写出状态转移方程和阶段效益式; 5)最优值函数:是定义在全过程和所有后部子过程的函数,具有可分离性,与原问题目标相关,写出递推方程及初始条件。 例 用动态规划方法求如下优化问题的最优解: 例 用动态规划方法求如下优化问题的最优解: 分两步:逆推确定各状态的最优值函数及最优决策规则,顺推确定最优过程及最优策略。 动态规划的主要缺点是所谓的“维数灾”。 资源分配问题 * k sk dk sk+1 rk 例: 某公司拟将50万元资金投放下属A、B、C三个部门,各部门在获得资金后的收益如表所示,用动态规划方法求总收益最大的投资分配方案(投资数以10万元为单位)。 50 40 30 20 10 0 C 70 45 25 10 0 0 B 30 28 25 20 15 0 A 收 益 (万元) 50 40 30 20 10 0 投放资金(万元) *
文档评论(0)