动态规划理论部分培训资料.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 动态规划; 动态规划是解决多阶段决策过程最优化问题的一种方法。在二十世纪五十年代由美国数学家理查德.贝尔曼(Richard.Ba11man)首先提出的。它可以把一个 n 维最优化问题转化为 n 个一维最优化问题来求解。;一、多阶段决策问题; 例1: (最短路程问题)设从A地到E地要铺设一条管道,其中要经过若干个中间点(如图)。图中两点之间连线上的数字表示两地间的距离。现在要选择一条铺设管道的路线,使总长度最短。; 在这个问题中,从A到B 1 ,B2 , B3中的哪一个点要作出一项决策,从B 1 ,B2 , B3某点到 C 1,C2,C3 中的哪一个点又要作出一项决策等等。所以总共要作出四个决策。因此,我们可以把整个路程分为A,B ( 包括B 1 ,B2 , B3) ,C ( 包括C 1,C2 , C3 , ) ,D (包括D1和D2),E 四个阶段。这就是一个多阶段的决策问题。;以上面的例1来说明动态规划解决问题的思想。设:;例如,在最短路线问题中,如果找到了A到E的最短路:; 下面按上述思想,将例1从最后一段开始计算,由后向前逐步推移至A点。;2;2;2;2;2;2;2;2;2;2;2;三、动态规划的基本概念;T1;(4)策略(policy);(5)状态转移方程; 过程指标函数是指从第k阶段至第n阶段所包含的各阶段的状态和决策所产生的总的效益值,记为: Vk,n=Vk,n(Sk,uk,Sk+1,uk+1,……,Sn,un); 把过程指标函数Vk,n对k子过程策略pk,n求最优,得到一个关于状态Sk的函数,称为最优值函数或贝尔曼函数,记为: 。即; 式中的“opt”(optimization)可根据具体问题的实际意而取min或max。;由最优性定理可知:; 其中:fk(sk)表示第k阶段初始状态为sk 时,k后部子过程的最优准则函数 。;正序递归方程:; 动态规划建模有以下过程: ①确定阶段与阶段变量 ②明确状态变量和状态可能集合。 ③确定决策变量和决策允许集合。 ④确定状态转移方程。 ⑤明确阶段效应和目标。;k=n时,动态规划基本方程是 ;k = n-1时,动态规划的基本方程是;k=1时,动态规划的基本方程是; 解 该问题可以作为三段决策过程。对A、B、C三个部门分配资金分别形成1,2,3三个阶段。sk表示给部门k分配资金时拥有的资金数。uk表示给部门k分配的资金数(万元为单位)。状态转移方程是 sk+1=sk- uk。目标函数是阶段效应求和。;递归方程为:;s2=1;(3)K=1时 (第1阶段) S1 ={ 5 };应用顺序追踪可知:最优方案有两个:;例3:逆推解法求解下面问题: ;令最优值函数f k(sk)表示为第k阶段的初始状态为sk时,从第k阶段到第3阶段所得到的最大值。 ;由          ,得       和   (舍去) ;又        ,而          故为     极大值点。 ;求导并令导数等于0可得:   ,故 ;因此最优解为:    ,    ,    , ;例4:正推解法求解下面问题: ;由顺推解法,          即最优解x1*=s2, ;最优解 ;因此最优解为:    ,    ,    , ; 例5:用正推解法求解下面问题: ;设: 3x1=s1, s1+2x2=s2, s2+ x3=s3≤9 ;由     ,得   (它不在决策集  内) ;由         ,得 ;而 ;作业 用动态规划法求解:

文档评论(0)

日度 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档