- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章 动态规划 §8-1 引例 §8-2 动态规划的基本概念和基本原理 §8-3 背包问题 §8-4 复合系统的可靠性问题 整个过程的最优策略应具有这样的性质: 无论过去的状态和决策如何, 对前面的决策所形成的状态而言, 后续的诸决策必须构成最优策略; 上一条成立的条件是损益递推函数严格单调。 例: 卡车的最大运货重量为 12 吨, 容积为 10 立方米, 现有A , B 两种货物, 重量分别为 3 吨和 4 吨, 体积分别为 1 和 5 立方米, 运费分别为 2 和 3 元, 如何装载使所得运费最大。 由资源条件可知最多可装载 4 件 A 或 2 件 B。 分析: 阶段可按货物种类划分, k = 1, 2 每阶段剩余的载货能力(重量与容积)为该阶段的状态, 状态变量 sk = (s1k, s2k); 决策变量 xk 表示 k 阶段资源的占用量; 状态转移方程: sk+1= sk-akxk , ak=(a1k, a2k) 损益函数为: fk(sk)=max{ckxk+fk+1(sk+1)} 该问题为整数非线性规划,可以用动态规划求解,设关键器件数n = 3,总费用为120万元。器件的单价与可靠性如下表: 分析: 阶段与器件挂钩,第 i 阶段仅考虑器件 i 的采购数量; si 表示 i 阶段可使用的采购费用; xi 表示 i 阶段决定购买 i 器件的数量; 状态转移方程: si+1 = si - ci xi; 递推损益函数: fi(si) = max { ( 1 - pixi ) fi+1(si+1)}。 i = 1 f1(120) = max1?x1?3{0.9f2(90), 0.99f2(60), 0.999f2(30)} = max{0.9?0.84*, 0.99?0.4, 0.999?0 } = 0.756 i = 2 f2(90) = max{0.8f3(75) , 0.96f3(60) , 0.992f3(45) , 0.9984f3(30)} = max{0.8?0.875 , 0.96?0.875* , 0.992?0.75 , 0.9984?0.5} = 0.84 f2(60) = max {0.8f3(45), 0.96f3(30)} = max {0.8?0.75*, 0.96?0.5} = 0.6 f2(30) = max {0.8f3(15), 0?f3(30)} = 0 f3(75) = 0.875, f3(60) = 0.875, f3(45) = 0.75, f3(30) = 0.5, 因此, 最优解为: x1 = 1, x2 = 2, x3 = 3 * * §8-1 引例 一、最短路线问题: 如图为一线路网路,现在要铺设从地点A到地点E的铁路,中间需要经过3个点,第1个点可以是B1, B2 , B3 中的某一个点,第2个点可以是C1,C2,C3中的一个点,等等。各点之间,若能铺设铁路则在图中以连线表示,连线上的数字表示两点间的距离。要求选择一条A至E的最短铺设线路。 A B 1 B 2 B 3 C 1 C 2 C 3 D 1 D 2 E 3 6 4 7 7 4 5 6 5 3 4 2 3 6 5 3 4 4个阶段进行决策: 第1阶段:从A出发,终点可选择B1或B2或B3;第2阶段:从B1出发(如果第1阶段的决策导致终点为B1)终点可选择C1或C2;或从B2出发,终点可选择C1 , C2,C3;或从B3出发,终点可选择C2,C3。这样继续下去,直到第4阶段达到E。 本例共有12条不同的线路,比较它们的长度,最短线路为: A B3 C2 D1 E A B 1 B 2 B 3 C 1 C 2 C 3 D 1 D 2 E 3 6 4 7 7 4 5 6 5 3 4 2 3 6 5 3 4 §8-2 动态规划的基本概念和基本原理 一、动态规划的基本概念 (一)阶段 把一个复杂决策问题按时间或空间特征分解为若干(n)个相互联系的阶段(stage), 以便按顺序求解; 阶段变量描述当前所处的阶段位置,一般用下标 k 表示; (二)状态和状态变量 每阶段有若干状态(state), 表示某一阶段决策面临的条件或所处位置及运动特征的量,称为状态。反映状态变化的量叫作状态变量。 k 阶段的状态特征可用状态变量 Sk 描述; (三) 决策和决策变量 所谓决策就是确定系统过程发展的方案,决策的实质是关于状态的选择,是决策者从给定阶段状态出发对下一阶段状态作出的选择。 用以描述决策变化的量称之决策变
文档评论(0)