第5节 动态规划.pptVIP

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
综 述 §5.1 多阶段决策问题 §5.2 最优化原理 §5.3 确定性的定期多阶段决策问题 §5.4 确定性的不定期多阶段决策问题 §5.1 多阶段决策问题 从A点到E点要铺设一条天然气管道, 中间必须经过三个中间站, 第一站可在B1、B2、B3中选择, 第二站可在C1、C2、C3中选择, 第三站可在D1、D2、D3中选择, 要求选择一条由A 到E的铺管路线,使总长度最短。 其中两点连线上的数字表示两点间管线的长度。 例2 多阶段资源分配问题 设有数量为x的某种资源,将它投入两种生产方式A和B中:以数量y投入生产方式A,剩下的量投入生产方式B,则可得到收入g(y)+h(x-y),其中g(y)和h(y)是已知函数,并且g(0)=h(0)=0;同时假设以y与x-y分别投入两种生产方式A,B后可以回收再生产,回收率分别为a与b。试求进行n个阶段后的最大总收入。 例2 多阶段资源分配问题-续(1) 若以y0与x-y0分别投入生产方式A与B,在第一阶段生产后所得收入为g(y0)+h(x-y0),回收的总资源为x1=ay0+b(x-y0),再将x1投入生产方式A和B(其中投入A的量为y1),则可得到收入g(y1)+ h(x1-y1),继续回收资源x2=ay1+b(x1-y1),…… 若上面的过程进行n个阶段,我们希望选择n个变量y0,y1,y2,…,yn-1,使这n个阶段的总收入最大。 因此,我们的问题就变成:求 y0, y1, y2 ,…, yn-1,以使 g(y0)+h(x-y0)+ g(y1)+h(x1-y1)+ …+g(yn-1)+h(xn-1-yn-1) 达到最大,且满足条件 x1=ay0+b(x-y0) x2=ay1+b(x1-y1) … … … xn-1=ayn-2+b(xn-2-yn-2) yi与xi均非负,i=1,2, …,n-1 例3 生产和库存问题 某工厂生产某种季节性商品,需要作下一 年度的生产计划,假定这种商品的生产周期需 要两个月,全年共有6个生产周期,需要作出 各个周期中的生产计划。 设第i个周期的生产量为xi,周期末的存储量为ui,那 么这个问题用式子写出来就是:求x1,x2,…,x6,满足条件: x1+u0=5+u1, x2+u1=5+u2, x3+u2=10+u3 x4+u3=30+u4 , x5+u4=50+u5, x6+u5=8 0≤ xi ≤ 30, u0 =0, uj≥0, i=1,2,…,6; j=1,2, …,5. 使 S= = 为最小,其中 例4.机金矿问题 两个金矿A,B分别有存储量x,y,现有一部开矿机器,如果开采金矿A,则以概率p1得储量x的r1倍(0 r11),并且机器没有损坏,可以继续再去开采金矿A或B。同时又以概率1- p1宣告失败,机器报废,也得不到金子;如果把这部开矿机器用以开采金矿B,则以概率p2得到储量y的r2倍(0r21),并且机器没有损坏,可以继续再去开采金矿A或B,同时又以概率1- p2宣告失败,机器报废,也得不到金子。 把机器用于开采金矿A或者B,如果机器没有损坏,将继续把机器用于开采金矿A或者B,直到机器损坏,问应该如何选择开矿的序列使获得金子的期望值最大。 一般多阶段决策问题 有一个系统,可以分成若干个阶段,任意一个阶段k,系统的状态可以用xk表示(可以是数量、向量、集合等)。在每一阶段k的每一状态都有一个决策集合Qk(xk),在Qk(xk)中选定一个决策qk,状态xk就转移到新的状态xk+1=Tk(xk, qk),并且得到效益Rk(xk, qk)。我们的目的就是在每一个阶段都在它的决策集合中选择一个决策,使所有阶段的总效益达到最大。 这样的

您可能关注的文档

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档