(精选)运筹学概论 第6章 动态规划课件.pptVIP

(精选)运筹学概论 第6章 动态规划课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
演示文稿演讲PPT学习教学课件医学文件教学培训课件

第6章 动态规划 ;第一节 多阶段决策过程的最优化 ; 动态规划是解决复杂系统优化问题的一种方法。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等,是解决动态系统多阶段决策过程的基本方法之一。 动态规划模型的分类:①离散确定型;②离散随机型;③连续确定型;④连续随机型。其中离散确定型是最基本的。;例1 最优路径问题——离散确定型 给定一个交通网络图如下,其中两点之间的数字表示距离(或花费),试求从A点到G点的最短距离(总费用最小); (1)多阶段决策过程,也称序贯决策。在多阶段决策过程中,总可以按照时间(也可人为引入)进程分为状态相互联系而又相互区别的各个阶段; (2)整个活动过程总体效果最优。各时段决策有机联系,上阶段影响下一阶段决策,进而影响总体。每个阶段都要进行决策,但最终要使整个过程的决策达到最优效果。;1、系统所处的阶段和状态是进行决策的重要因素; 2、在系统发展的不同时刻(或阶段)根据系统所处的状态,不断地做出决策; 3、找到不同时刻的最优决策以及整个过程的最优策略。;例4 生产决策问题 企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。 某工厂每月需供应市场一定数量的产品,并将所余产品存入仓库。一般某月适当增加产量可降低生产成本,但超产部分存入仓库会增加库存费用。要求确定一个逐月的生产计划,在满足需求条件下,使一年的生产与存贮费用之和最小。 显然,可以把每个月作为一个阶段,全年分为12个阶段逐次决策。 ;例5 投资决策问题 某公司现有资金Q万元,在今后5年内考虑给A,B,C,D 4个项目投资,这些项目投资的回收期限、回报率均不相同,问该公司应如何确定这些项目每年的投资额,使到第5年末拥有资金的本利总额最大。 这是一个5阶段决策问题。;例 6 设备更新问题 企业在使用设备时都要考虑设备的更新问题,因为设备越陈旧所需的维修费用越多,但购买新设???则要一次性支出较大的费用。现某企业要决定一台设备未来8年的更新计划,已预测了第j年购买设备的价格为Kj,设Gj为设备经过j年后的残值,Cj为设备连续使用j-1年后在第j年的维修费(j=1,2,…,8),问应在哪些年更新设备可使总费用最小。 这是一个8阶段决策问题,每年年初要作出决策,是继续使用旧设备,还是购买新设备。; 不包含时间因素的静态决策问题(本质上是一次决策问题)也可以适当地引入阶段的概念,作为多阶段的决策问题用动态规划方法来解决。 线性规划、非线性规划等静态的规划问题也可以通过适当地引入阶段的概念,应用动态规划方法加以解决。;第5章 动态规划 ;第二节 动态规划的基本概念和基本原理 ; 1. 阶段、阶段变量; 例2中,从A到F可以分成从A到B (B有两种选择B1,B2),从B到C (C有四种选择C1,C2,C3,C4),从C到D (D有三种选择D1,D2 ,D3),从D到E (E有两种选择E1,E2),再从E到F五个阶段。 k=1,2,3,4,5。 ; 状态变量的取值有一定的允许集合或范围,此集合称为状态集合,用Sk表示。 sk? Sk; 在例2中,第一阶段状态为A,第二阶段则有二个状态:Bl,B2。状态变量s1的集合 ,后面各段的状态集合分别是: ; 动态规划中的状态??具有如下性质:当某阶段状态给定以后,在这阶段以后过程的发展不受这段以前各段状态的影响。也就是说,当前的状态是过去历史的一个完整总结,过程的过去历史只能通过当前状态去影响它未来的发展,这称为无后效性。如果所选定的变量不具备无后效性,就不能作为状态变量来构造动态规划模型。 例 2中,当某段的初始状态已选定某个点时,从这个点以后的铺管路线只与该点有关,不受以前的铺管路线影响,所以满足状态的无后效性。 ; 在实际问题中决策变量的取值往往在某一范围之内,此范围称为允许决策集合。常用 Dk(sk) 表示第 k 阶段从状态sk出发的允许决策集合。 ; 在例2中,从第二阶段的状态B1出发,可选择下一段的C1,C2,C3,即其允许决策集合为: ; 由每段的决策按顺序排列组成的决策函数序列称为k子过程策略,简称子策略,记为pk,n(sk),即; 状态转移方程是确定过程由一个状态到另一个状态的演变过程。如果第k阶段状态变量 sk 的值、该阶段的决策变量一经确定,按照动态规划的无后

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档