教案动态规划改.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
教案动态规划改

第九章 动 态规划应用举例 资源分配问题 生产与存贮问题 设备更新问题 1.2 资源连续分配问题: 一般问题的提法是 A种生产 数量u1投入 收益g(u1) 年终资源回收率a 如此进行n年,如何确定投入A的资源量u1、…、un,使总收入最大? B种生产 数量s1-u1 收益h(s1-u1) 年终资源回收率b 资源数量 s1 第一年 资源数量 s2=au1+b(s1-u1) 第二年 A种生产 数量u2投入;收益g(u2);年终回收率a B种生产 数量s2-u2;收益h(s2-u2);年终回收率b 到n年 此问题的静态规划问题模型为: 动态规划的逆推关系方程为: 最后求得得f1(s1)即为所求问题的最大收入。 高负荷: 产量函数 g=8u1, u1是投入生产的机器 数量,年完好率为 a=0.7, 低负荷: 产量函数 h=5y, y是投入生产的机器数量, 年完好率为b=0.9。 假定开始生产时完好机器的数量为1000台。 机器 例2 机器负荷分配问题 解:设阶段数k表示年度。 试问每年如何安排机器在高低两种负荷下的生产,可使5年内生产的产品总产量最高。 状态变量sk为第k年度初拥有的完好机器台数; 决策变量uk为第k年度中分配高负荷下生产的机 器台数。 低负荷下生产的机器台数是sk-uk。 状态转移方程 第k年度产量为 递推方程为 指标函数为 允许决策集合 0?uk?sk 当k=5时 , f5(s5)= max ﹛8u5+5﹙ s5 - u5 ﹚ + f6(s6) ﹜ 0≤u5 ≤ s5 =max ﹛3u5+5 s5 ﹜ 0≤u5 ≤ s5 u5*= s5 , f5(s5)=8 s5 当k=4时 , f4(s4)= max ﹛8u4+5( s4 – u4 ) + f5(0.7 u4+0.9(s4 – u4 )) ﹜ 0≤u4 ≤ s4 = max ﹛13.6u4+12.2( s4- u4)﹜ 0≤u4 ≤ s4 = max ﹛1.4u4+12.2 s4﹜ 0≤u4 ≤ s4 u4*= s4 , f4(s4)=13.6s4 动态规划方法的理论基础是基于R. Bellman提出的最优性原理:“一个过程的最优策略具有这样的性质:即无论其初始状态及初始决策如何,对于先前决策所形成的状态而言,余下的诸决策仍构成最优策略。” A M B 1 . 理论基础 适应于用动态规划方法求解的是具有无后效性的多阶段决策过程。 最优性原理的含义是:最优策略的任何一部分子策略,也是它相应初始状态的最优策略。每个最优策略只能由最优子策略构成。 动态规划的最优性定理:设阶段数为n的多阶段决策过程,其阶段编号为k=0,1,...,n-1。允许策略 是最优策略的充要条件是对任意一个k, 0kn-1和s0?S0,有 它是由给定的初始状态s0和子策略p0,k-1所确定的k段状态。当V是效益函数时,opt取max;当V是损失函数时,opt取min. 证明:必要性( ) 充分性( )设p0,n-1=(p0,k-1,pk,n-1)为任一策略,sk为由(s0,p0,k-1)所确定的k阶段的起始状态,则有(以最大化为例) 推论:若允许策略p*0,n-1是最优策略,则对任意的k,0kn-1,它的子策略p*k,n-1对于以 s*k=Tk-1(s*k-1,u*k-1) 为起点的k到n-1子过程来说,必是最优策略。 (注意:k段状态s*k,是由s0和p*0,k+1所确定的) 2. 具体迭代方法:作为练习,请同学们根据例题,自己写出。 第五节 动态规划与静态规划之间的关系及其相关总结 动态规划解法 逆序法 顺序法 动态规划 动态规划 区别 关系 静态规划 静态规划 线性规划 静态规划

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档