第10篇-动态规划.ppt

  1. 1、本文档共93页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
离散随机性动态规划 由上可知,最优的采购策略为:在第1、2、3周的市场价格为450时,应该立即采购,否则等待;在第4周时,若市场价格为450或470时,应该采购,否则等待。若等到第五周,只能采购。 ? ? * 本章完 第九章 目标规划 教材P226-227 : 1; 2; 3; 4 * 呈k的指数增长:例如当 k=20时,要做七亿二千五百多万次加法,要做三千八百多万次比较。 * 呈k的指数增长:例如当 k=20时,要做七亿二千五百多万次加法,要做三千八百多万次比较。 * 呈k的指数增长:例如当 k=20时,要做七亿二千五百多万次加法,要做三千八百多万次比较。 * 以上过程,仅用了22次加法,计算效率远高于穷举法 * Opt:maximize 或 minimize 可乘性指标函数:递推公式中,加号变乘号 * * * * *   利用递推关系可以从表10-20,表10-19,表10-18和表10- 17得到两组最优解:    这时有最低总成本29。 例 5. 动态规划求解“生产与存储“问题 例6. 系统可靠性问题 某科研项目组由三个小组用不同的手段分别研究,它们失败的概率各为0.40,0.60,0.80。为了减少三个小组都失败的可能性,现决定给三个小组中增派两名高级科学家,到各小组后,各小组科研项目失败概率如下表: 问如何分派科学家才能使三个小组都失败的概率(即科研项目最终失败的概率)最小? 高级科学家 小组 1 2 3 0 0.40 0.60 0.80 1 0.20 0.40 0.50 2 0.15 0.20 0.30 解:用逆序算法。设 阶段:每个研究小组为一个阶段 阶段 1 2 3 小组 1 2 3 例6. 系统可靠性问题 高级科学家 小组 1 2 3 0 0.40 0.60 0.80 1 0.20 0.40 0.50 2 0.15 0.20 0.30 计算 当 k = 3 时, 当 k = 2时, s3 f3*(s3) x3* 0 0.80 0 1 0.50 1 2 0.30 2 x2 s2 f2(s2,x2)=P2(x2) ·f3*(s2-x2) f2*(s2) x2* 0 1 2 0 0.48 0.48 0 1 0.30 0.32 0.30 0 2 0.18 0.20 0.16 0.16 2 例6. 系统可靠性问题 高级科学家 小组 1 2 3 0 0.40 0.60 0.80 1 0.20 0.40 0.50 2 0.15 0.20 0.30 当 k = 1 时, 最优解为 x1*=1,x2*=0,x3*=1;科研项目最终失败的概率为0.060。 x1 s1 f1(s1,x1)=P1(x1) ·f2*(s1-x1) f1*(s1) x1* 0 1 2 2 0.064 0.060 0.072 0.060 1 例6. 系统可靠性问题 高级科学家 小组 1 2 3 0 0.40 0.60 0.80 1 0.20 0.40 0.50 2 0.15 0.20 0.30 §4 动态规划的应用(2)* 一、连续确定性动态规划 对于状态变量和决策变量只取连续值,过程的演变方式为确定性时,这种动态规划问题就称为连续确定性动态规划问题。 §4 动态规划的应用(2)* 机器负荷分配问题 例1: 一种机器能在高低两种不同的负荷状态下工作。设机器在高负荷下生产时,产量函数为P1=8u1,其中u1为在高负荷状态下生产的机器数目,年完好率为a=0.7,即到年底有70%的机器保持完好。在低负荷下生产时,产量函数为P2=5u2,其中u2为在低负荷状态下生产的机器数目,年完好率为b=0.9。设开始生产时共有1000台完好的机器,请问每年应该如何把完好机器分配给高、低两种负荷下生产,才能使得5年内生产的产品总产量最高。 §4 动态规划的应用(2)* 解 建立动态规划模型: 分为5个阶段,每个阶段为1年。设状态变量sk表示在第k阶段初拥有的完好机器数目;k=1,2,3,4,5。 决策变量xk表示第k阶段中分配给高负荷状态下生产的机器数目;k=1,2,3,4,5。显然sk-xk为分配给低负荷状态下生产的机器数目。 状态转移方程为 sk+1=0.7xk+0.9(sk-xk)

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档