824逆序解法与顺序解法.pptxVIP

下载本文档

19
0
约4.96千字
约 35页
2020-02-18 发布于上海
举报
版权申诉

824逆序解法与顺序解法.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1 8.2-4 逆序解法与顺序解法反向递推的求解过程是动态规划方法的一个重要特征，这种解题方法的寻优方向与全过程的发展方向相反。求解动态规划的另一种重要方法是正向递推，即是从始点出发逐段正向递推计算，直至终点，以求得全过程的最优解。这时寻优方向与全过程的发展方向是一致的。用正向递推建立的动态规划函数基本方程如下： 2 为从初始阶段出发到第 k 阶段状态 sk 止采取最优子策略或最优策略所获得的最优指标函数值。为系统在第 k 阶段状态 sk 时采取决策的阶段指标。状态变量 sk 则描述该阶段结束时的系统状况。状态转移方程：从本质上讲，顺序解法和逆序解法原理（除去其方向因素外）是相同的，在具体的求解过程中，都是将原问题转化为一系列单个问题的求解。但是，两种方法各有优势，前向法求解下面例8.3时，有明显的优势。一般地，当初始状态给定时，用逆推法比较方便；当终止状态给定时，用顺推法比较方便。后向法求出了各点到目标地的最短路线；而前向法求出了起点到各目的地的最短路线。这里， 3 例8.3 2 3 1 1 3 2 1 2 4 3 2 4 2 1 C1 C3 D1 A B1 B3 B2 D2 C2 图8.3 4 　　线性规划和非线性规划所研究的问题，通常都是与时间无关的，故又可以称为静态规划；静态规划与动态规划在很多情况下（原则上）是可以相互转换的。动态规划可以看作是求 d1, d2,…, dn 使得指标函数 v1n(d1, d2,…, dn ) 达到最优的极值问题，状态转移方程，起始条件以及允许状态集，允许决策集等是约束条件，原则上它可以用线性规划或非线性规划方法求解；反过来，一些静态规划只要适当引入阶段变量、状态、决策变量等要素就可以用动态规划方法来求解。 8.3 动态规划应用举例动态规划和静态规划 5 所谓资源分配问题，就是将数量一定的一种或若干种资源(如资金、原材料、机器设备、劳动力等)恰当的分配给若干个使用者，从而使得总的经济效益最大。一种资源分配问题可叙述如下：设有数量为 a 的某种资源，用于生产 n 种产品，若以数量为 xi 的资源投入第 i 种产品的生产，其收益相应的为 gi (xi)，问如何分配这种资源，才能使得生产 n 种产品的总收入最大？ 8.3.1 资源分配问题 6 (2) 状态变量：　 (1) 阶段变量： ,这里把资源分配给一个或者几个使用者的过程作为一个阶段。种产品的原料数量；其静态规划的数学模型的形式一般为：转化成动态规划模型为： 7 注：利用动态规划进行逐段计算，最后求得即为所求问题的最大总收入。 (3) 决策变量： (6) 递推关系式：允许决策集： (4) 状态转移方程： (5) 阶段指标： 8 p205 例4 巡逻队问题阶段变量 k：把9只巡逻队往三个部位派遣依次分成三个阶段（ k =1, 2, 3 ）决策变量 xk：表示第 k 阶段派出巡逻队数状态变量 sk：表示第 k 阶段派出巡逻队后，剩余的巡逻队数状态转移方程： sk-1 = sk + xk 阶段指标 pk(xk) ：表示第 k 阶段派出巡逻队xk时，该阶段的预期损失值解（顺序解法） 9 p205 例4 巡逻队问题（续）递推关系式：当 k=1 时，(s0=9) x1 s1 p1( x1) f1 (s1) x1* 2 3 4 5 10 10 4 6 14 14 3 7 18 18 2 10 当 k=2 时 x2 s2 p2( x2) + f1 (s1) f2 (s2) x2* 2 3 4 2 - 35+10 31+14 45 3或4 3 38+10 35+14 31+18 48 2 4 38+14 35+18 - 52 2 当 k=3 时 x3 s3 p3( x3) + f2 (s2) f23(s3) x3* 2 3 4 0 24+45 22+48 21+52 69 2 结果 11 p205 例4 巡逻队问题阶段变量 k：把9只巡逻队往三个部位派遣依次分成三个阶段（ k =1, 2, 3 ）决策变量 xk：表示第 k 阶段派出巡逻队数状态变量 sk：表示第 k 阶段初可派遣的巡逻队数状态转移方程： sk+1 = sk - xk 阶段指标 pk(xk) ：表示第 k 阶段派出巡逻队xk时，该阶段的预期损失值解（逆序解法） 12 p205 例4 巡逻队问题（续）