[工程科技]动态规划.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工程科技]动态规划

例4 某一警卫部门共有12支巡逻队,负责4个要害部位A、B、C、D的警卫巡逻。 对每个部位可分别派出2-4支巡逻队,并且由于派出巡逻队数的不同,各部位预期在一段时期内可能造成的损失有差别,具体数字见表。 问该警卫部门应往各部位分别派多少支巡逻队,使总的预期损失为最小。 [解]-1 阶段变量k :把12支巡逻队往4个部位派遣看成依次分四个阶段(k=1,2,3,4)。 状态变量sk:表示每个阶段初拥有的可派遣的巡逻队数是前面阶段决策的结果,也是本阶段决策的依据 决策变量xk:表示各阶段对各部位派出的巡逻队数, 各阶段允许的决策集合Dk(sk)为: Dk(sk)={xk|2≤xk≤4|} (k=1,2,3,4) [解]-2 状态转移方程:sk+1=sk-xk (k=1,2,3) 每阶段初拥有可派遣的巡逻队数量等于上阶段初拥有的数量减去上阶段派出的数量 过程函数为阶段指标函数之和: 阶段指标函数gk(xk)表示k阶段派出的巡逻队数为xk时,该阶段的单位的预期损失值 [解]-3 fk(sk):表示从k阶段状态为xk出发,采用最优子策略到过程结束时的预期损失值,有 先考虑给D部位派巡逻队,即k=4,上式可写为 边界条件f5(s5)=0 ,所以 [解]-4 [解]-5 联合考虑对C、D两个部位派巡逻队,k=3,有: 因D3(s3)={2,3,4},4≤s3≤8,可得如下结果 [解]-6 考虑对B、C、D三个部位派巡逻队,k=2,有 由D2(s2)={2,3,4},8≤s2≤10,可得如下结果 [解]-7 考虑对A、B、C、D四个部队派巡逻队,即k=1时,有 因s1=12, D1(s1)={2,3,4},可得如下结果 [解]-8 由s1=2得 [解] (1)阶段变量k:合同期为三个月,投产一批的周期为一个月,作为一个阶段。故可将整个合同期划分为三个阶段,k=1,2,3。 (2)状态变量sk。假定尚没有一台合格品时sk=1,已得到一台以上合格品时sk=0。故签订合同时有s1=1。 (3)决策变量xk为每个阶段的投产试制台数。 允许决策集合Dk(sk) Dk(sk)={1,2,…,N} (当sk=1); Dk(sk)={0}(当sk=0) (4)状态转移律为 (6)设fk(sk)为从状态sk、决策xk出发的k阶段以后的最小期望费用。 当k=2时, 可能的状态集合为 记 令 ,得 因 是存在唯一最大值的二次抛物线,则: 基本方程 对应的 当k=1时, 有: 记 ,带入 得: 得 由 得 当 时 ,即 时, 取得最大值 即最优解为: 例6.8 用逆序法求解下面问题: 解 3阶段决策问题,状态变量为 s1, s2, s3, 决策变量 x1, x2, x3,状态转移方程 允许决策集合 Dk(sk)为 用逆序法求解: 最优解为 , 最优解为 , K=3 K=2 K=1 由于已知 ,因而按计算的顺序反推计算,可得各阶段的最优决策和最优值,即: 例6.9 用动态规划方法求解线性规划问题 : 解 确定x1、x2的值看作分2个阶段的决策,s1k、s2k、s3k表示k阶段初各约束条件右端项的剩余值 状态转移方程: 指标函数: 基本方程: K=2 K=1 即 最优解: x1*=2,x2*=6, Z*=3×2+5×6=36 由: 得: 四 随机动态规划问题举例 例6.10 某厂和公司订了试制某种新产品的合同。如果三个月生产不出一个合格品,则要罚款2000元,每次试制的个数不限,试制周期为一个月,制造一个产品的成本为100元,每一个试制品合格的概率为0.4,生产一次的装配费为200元。问如何安排试制,每次生产几个,才能使期望费用最小? (5)第k阶段的费用支出为c(uk),有 k=1时 f 1 =max{g 1 ( x1 )+ f 2 } x1 ∈ D 1( s1 ) 且 k=1 时,必将资金全部投出,即只分析 s 1 = 5 5 9+0 7+2 6+4

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档