824逆序解法与顺序解法.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 8.2-4 逆序解法与顺序解法 反向递推的求解过程是动态规划方法的一个重要特征,这种解题方法的寻优方向与全过程的发展方向相反。 求解动态规划的另一种重要方法是正向递推,即是从始点出发逐段正向递推计算,直至终点,以求得全过程的最优解。这时寻优方向与全过程的发展方向是一致的。用正向递推建立的动态规划函数基本方程如下: 2 为从初始阶段出发到第 k 阶段状态 sk 止采取最 优子策略或最优策略所获得的最优指标函数值。 为系统在第 k 阶段状态 sk 时采取决策 的阶段指标。状态变量 sk 则描述该阶段结束时的系统状况。 状态转移方程: 从本质上讲, 顺序解法和逆序解法原理(除去其方向因素外)是相同的,在具体的求解过程中,都是将原问题转化为一系列单个问题的求解。 但是,两种方法各有优势,前向法求解下面例8.3时,有明显的优势。一般地,当初始状态给定时,用逆推法比较方便;当终止状态给定时,用顺推法比较方便。 后向法求出了各点到目标地的最短路线;而前向法求出了起点到各目的地的最短路线。 这里, 3 例8.3 2 3 1 1 3 2 1 2 4 3 2 4 2 1 C1 C3 D1 A B1 B3 B2 D2 C2 图8.3 4   线性规划和非线性规划所研究的问题,通常都是与时间无关的,故又可以称为静态规划; 静态规划与动态规划在很多情况下(原则上)是可以相互转换的 。动态规划可以看作是求 d1, d2,…, dn 使得指标函数 v1n(d1, d2,…, dn ) 达到最优的极值问题,状态转移方程,起始条件以及允许状态集,允许决策集等是约束条件,原则上它可以用线性规划或非线性规划方法求解;反过来,一些静态规划只要适当引入阶段变量、状态、决策变量等要素就可以用动态规划方法来求解。 8.3 动态规划应用举例 动态规划和静态规划 5 所谓资源分配问题,就是将数量一定的一种或若干 种资源(如资金、原材料、机器设备、劳动力等)恰当的 分配给若干个使用者,从而使得总的经济效益最大。 一种资源分配问题可叙述如下:设有数量为 a 的某 种资源,用于生产 n 种产品,若以数量为 xi 的资源投 入第 i 种产品的生产,其收益相应的为 gi (xi),问如何 分配这种资源,才能使得生产 n 种产品的总收入最大? 8.3.1 资源分配问题 6 (2) 状态变量:   (1) 阶段变量: ,这里把资源分配给一个 或者几个使用者的过程作为一个阶段。 种产品的原料数量; 其静态规划的数学模型的形式一般为: 转化成动态规划模型为: 7 注:利用动态规划进行逐段计算,最后求得即为所求问题的最大总收入。 (3) 决策变量: (6) 递推关系式: 允许决策集: (4) 状态转移方程: (5) 阶段指标: 8 p205 例4 巡逻队问题 阶段变量 k:把9只巡逻队往三个部位派遣依次分成三个阶段( k =1, 2, 3 ) 决策变量 xk:表示第 k 阶段派出巡逻队数 状态变量 sk:表示第 k 阶段派出巡逻队后,剩余的巡逻队数 状态转移方程: sk-1 = sk + xk 阶段指标 pk(xk) :表示第 k 阶段派出巡逻队xk时,该阶段的预期损失值 解(顺序解法) 9 p205 例4 巡逻队问题(续) 递推关系式: 当 k=1 时,(s0=9) x1 s1 p1( x1) f1 (s1) x1* 2 3 4 5 10 10 4 6 14 14 3 7 18 18 2 10 当 k=2 时 x2 s2 p2( x2) + f1 (s1) f2 (s2) x2* 2 3 4 2 - 35+10 31+14 45 3或4 3 38+10 35+14 31+18 48 2 4 38+14 35+18 - 52 2 当 k=3 时 x3 s3 p3( x3) + f2 (s2) f23(s3) x3* 2 3 4 0 24+45 22+48 21+52 69 2 结果 11 p205 例4 巡逻队问题 阶段变量 k:把9只巡逻队往三个部位派遣依次分成三个阶段( k =1, 2, 3 ) 决策变量 xk:表示第 k 阶段派出巡逻队数 状态变量 sk:表示第 k 阶段初可派遣的巡逻队数 状态转移方程: sk+1 = sk - xk 阶段指标 pk(xk) :表示第 k 阶段派出巡逻队xk时,该阶段的预期损失值 解(逆序解法) 12 p205 例4 巡逻队问题(续)

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档