第4节一般数学模型的动态规划解法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4节一般数学模型的动态规划解法

安徽科技学院 最优化技术 例1 某公司有资金10万元,若投资于项目i(i=1,2,3)的投资额为xi时,其收益分别为g1(x1)=4x1,g2(x2)= 9x2 , g3(x3)=2x32,问应如何分配投资数额才能使总收益最大? 一、非线性规划问题的动态规划解法 解 静态规划模型: 第四节 一般数学模型的动态规划解法 1.连续变量的一般解法 为了应用动态规划方法求解,人为地赋予它“时段” 的概念,将投资项目排序,首先考虑对项目1投资,然后考虑对项目2投资……,即把问题划分为3个阶段,每个阶段只决定对一个项目应投资的金额。 通常把决策变量uk定为原静态规划的变量xk即设 状态变量和决策变量有密切关系,状态变量一般为累计量或随递推过程变化的量。 可把每阶段可供使用的资金定为状态变量sk,初始状态为s1=10 u1为可分配用于第一种项目的最大资金,则第一阶段时有: 第二阶段(k=2)时,状态变量s2为余下可投资于其余两个项目的资金,即: 一般地,当第k段时 于是有 状态变量sk:第k阶段可以投资于第k项到第3个项目的资金 决策变量xk:决定给第k项目的资金 状态转移方程:sk+1=sk-uk 指标函数: 最优指标函数fk(sk):当可投资金为sk时,投资第k-3项所得最大收益。基本方程为: 0 s s2 x2 当k=2时, 这是一个函数求极值问题,利用微分方法可求得该函数有极小值. 当k=3时, 显然当 ,函数取极大值为 要讨论s2的具体情况: 当 时, 当 时, 此时 此时 到此,第二阶段的决策已经作出 减函数 此结论与前矛盾,故舍去 当k=1时, 时 注:此时 由前面分析可知 而 另取 此时 又是一个求极值问题,微分求解 比较[0,10]的端点 当 时, 当 时, 再由递推方程递推: 最优方案为全部资金投到第三个项目 2.连续变量的离散化解法: 例如投资分配问题 的一般静态模型为: 建立它的动态规划模型,其基本方程为: 其状态转移方程为:sk+1=sk-xk 由于sk与xk都是连续变量,当各阶段指标gk(xk),没有特殊性质而较为复杂时,要求出fk(sk)比较困难,因而求全过程的最优策略也就相当不容易,这时常常采用把连续变量离散化的方法求其数值解,具体做法如下: (1)令sk=0, △,2△,…,m△=a,把区间[0,a]进行分割, △的大小可依据问题所要求的精度及计算机的容量来定。 (2)规定状态变量sk及决策变量xk只在离散的点0,△,2△, …, m△上取值,相应的指标函数fk(sk)就被定义在这些离散值上,于是递推方程变为: 其中 (3)按逆序方法,逐步递推求出fn(sn),…, f1(s1),最后求出最优资金分配方案。 例2 用连续变量的离散化求解 解 令 ,将区间[0,10]分割成0,2,6,8,10六个点,即状态变量sk集合为{0,2,4,6,8,10} 允许决策集合为 均在分割点上取值。 动态规划基本方程为: 当k=3时, 其中s3和x3的集合均为{0,2,4,6,8,10},计算结果如下表 s3 0 2 4 6 8 10 f3(s3) 0 8 32 72 128 200 x3* 0 2 4 6 8 10 计算结果如下表 s2 0 2 4 6 8 10 x2 0 0 2 0 2 4 0 2 4 6 0 2 4 6 8 0 2 4 6 8 10 g2+f3 0 8 18 32 26 36 72 50 44 54 128 90 68 62 72 200 146 108 86 80 90 f2 0 18 36 72 128 200 x2* 0 2 4 0 0 0 当k=2时, 计算结果如下表 s1 10 x1 0 2 4 6 8 10 g1 +f2 200 136 88 60 50 40 f1 200 x1* 0 当k=1时, 计算结果表明,最优决策为: 最大收益为: 与例5结论完全相同。 注意:这种方法有可能丢失最优解,一般得到原问题的近似解 练 习 用连续变量的离散化方法求解下面的非线性规划 令sk=0,1,2,3,4, 列表求解 逆序解法: 基本方程: 注意到目标函数是乘积的形式: 背包问题的一般提法是:一位旅行者携带背包去登山、已知他所能承受的背包重量限度为a千克,现有n种物品可供他选择装入背包。第i种物品的单件重量为ai干克、其价值(可以是表明本物品对登山的重要性的数量指标)是携带数量xi的函数ci(xi) (i=1,2,…n),问旅

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档