网站大量收购独家精品文档,联系QQ:2885784924

第7篇 章-动态规划 运筹学.ppt

  1. 1、本文档共164页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7篇 章-动态规划 运筹学.ppt

*;*;*;多阶段决策过程特点:;多阶段决策过程的特点;*;1.2 多阶段决策问题举例;1.2 多阶段决策问题举例;*;1.3 动态规划求解的多阶段决策问题的特点;*;*;返回;1.4 动态规划方法导引;*;*;1.4 动态规划方法导引;*;*;*;*;2.1 动态规划的基本概念;2.1动态规划的基本概念;*;*;*;*;*;*;*;*;*;*;*;*;*;*;*; 实际应用中上式可简写为 Rk(sk, uk) 或 Rk(sk) ; 过程指标函数 Rk(sk) 通常是描述所实现的全过程或 k 后部子过程效果优劣的数量指标,它是由各阶段的阶段指标函数 gk(sk, uk) 累积形成的。;*;*;*;*;*;*;*;8) 多阶段决策问题的数学模型 适于动态规划方法求解的一类多阶段决策问题,即具有无后效性的多阶段决策问题的数学模型:; 式中 “ opt ” 表示最优化,视具体问题取 max 或 min 。 上述数学模型说明了对于给定的多阶段决策过程,求取一个(或多个)最优策略 , 同时指出执行该最优策略时,过程 的状态演变序列即 最优路线;*; 该原理的具体解释是,若某一全过程最优策略为: 则对上述策略中所隐含的任一状态而言,第k子过程上对应于该状态的最优策略必然包含在上述全过程最优策略p1*中,即为;*;当过程指标函数为“和”的形式 时,相应的函数基本方程为;当过程指标函数为“积”的形式 时, 相应的函数基本方程为;*;7.3 动态规划方法的基本步骤;*;*; 在动态规划模型中,一般状态变量要选取那种可以进行累计的量。 在解静态规划模型时,线性与非线性规划中约束条件的个数,相当于动态规划中状态变量sk的维数.约束条件所表示的内容,就是状态变量sk所代表的内容。;*;*;*;⑥ 写出动态规划基本方程:;*;*;动态规划的四大要素 ① 状态变量及其可能集合 xk ? Xk ② 决策变量及其允许集合 uk ? Uk ③ 状态转移方程 xk+1= Tk (xk ,uk ) ④ 阶段效应 rk ( xk , uk ) ;*;3.1 求解最短路径问题的标号法(只适用于一类最优路线问题) 标号法是借助网络图通过分段标号来求出最优路线的一种简便、直观的方法。通常标号法采取“逆序求解”的方法来寻找问题的最优解,即从最后阶段开始,逐次向阶段数小的方向推算,最终求得全局最优解。;*;*;*;*;*;0;图7-3 某城市局部道路求最短路径的过程; 结果如图7-3所示。从S到E最短距离为21,共有三条最短路线: (1) (2) (3) 标号法不但给出起点到终点的最短路线和最短距离,同时给出每一状态到终点的最短路线及其最短距离。;*;*;*;*;求解基本方程 第4阶段的递推方程为;第3阶段的递推方程为:;*;第1阶段的递推方程为:;*;例:资源分配问题 现有资金 4 万元,投资A、B、C 三个项目,每个项目的投资效益与投入该项目的资金有关。三个项目A、B、C 的投资效益(万吨)和投入资金(万元)关系见下表:;建模: 1 阶段k:每投资一个项目作为一个阶段; 2 状态变量xk:投资第k个项目前的资金; 3 决策变量dk:第k个项目的投资; 决策允许集合:0≤dk≤xk 4 状态转移方程:xk+1=xk-dk 5 阶段指标:vk(xk ,dk)见表中所示; 6 递推方程: fk(xk)=max{vk(xk ,dk)+fk+1(xk+1)} 终端条件:f4(x4)=0;*;*;*;2.4 连续型动态规划问题;例:机器负荷分配问题;构造动态规划模型如下: 阶段k:运行年份(k =1, 2, 3, 4, 5, 6),其中 k =1表示第1年初, …, k = 6 表示第6年初(即第5年末)。 状态变量xk:第 k 年初完好的机器数(k =1, 2, 3, 4, 5, 6),其中x6表示第5年末(即第6年初)的完好机器数。 决策变量dk:第 k 年投入高负荷运行的机器数; 决策允许集合:Dk(xk)={dk|0?dk?xk}; ;*;求解基本方程: f5(x5)= max {8d5+5(x5-d5)+f6(x6)} 0?d5?x5 = max {3d5+5x5}=8x5, d5*=x5 0?d5?x5 f4(x4)= max {8d4+5(x4-d4)+f5(x5)} 0?d4?x4 = max {8d4+5(x4-d4

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档