动态规划基本理论推广.pptVIP

下载本文档

1
0
约5.2千字
约 58页
2023-04-12 发布于重庆
举报
版权申诉

动态规划基本理论推广.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

函数迭代法与策略迭代法 (3)假设从i点走三步到靶点5的最优距离为 , 则得：计算结果如下：管理科学与系统工程第二十页，共五十八页。函数迭代法与策略迭代法 (4)假设从i点走四步到靶点5的最优距离为 , 则得：计算结果如下：管理科学与系统工程第二十一页，共五十八页。函数迭代法与策略迭代法管理科学与系统工程第二十二页，共五十八页。函数迭代法与策略迭代法由于只有5个点,因而从任一点出发到达靶点,其间最多有4步(否则，有回路)，这样就不需继续下去了。将计算结果列成表：管理科学与系统工程 i 1 2 5 2 5 2 5 2 5 2 7 5 5.5 3 4.5 3 4.5 3 3 5 5 4 4 4 4 4 4 4 3 5 3 5 3 5 3 5 第二十三页，共五十八页。函数迭代法与策略迭代法分析上面的结果可得： ①从点1到点5走一步为最优，最优距离为2，最优路线；从点2到点5走三步为最优，最优距离为4.5,最优路线；从点3到点5走两步为最优，最优距离为4,最优路线；从点4到点5走一步为最优，最优距离为3，最优路线。管理科学与系统工程第二十四页，共五十八页。函数迭代法与策略迭代法 ②最优决策最多走4步，多于此步数，会出现走回头路或回路，显然这些不是最优路线。 ③从任一点出发到靶点，走m(m=1,2,…)步与走m+1步的最优距离一样，决策函数也一样，如果继续计算走m+2步、m+3步、……，其结果仍一样, 即也就说明一致收敛于，一致收敛于。故当这种一出现，计算便可停止。管理科学与系统工程第二十五页，共五十八页。函数迭代法与策略迭代法例1的求解：(策略迭代法）解：①第一步，先选取初始策略。如取：即 ,但必需没有回路，每点可达靶点。第二步，由求，由策略迭代法的方程组可得：因策略直达靶点，应先计算：管理科学与系统工程第二十六页，共五十八页。函数迭代法与策略迭代法第三步，由求 ,由求出它的解：时，管理科学与系统工程第二十七页，共五十八页。函数迭代法与策略迭代法所以，（不在含的项取）时，管理科学与系统工程第二十八页，共五十八页。函数迭代法与策略迭代法所以，同理，可求得 ,于是得到第一次策略迭代的结果为 ②以为初始策略继续反复使用第二、三步进行迭代。第二步：由求管理科学与系统工程第二十九页，共五十八页。函数迭代法与策略迭代法第三步：由求 ,即由求解。时，所以同理，求出故第二次策略迭代的结果为管理科学与系统工程第三十页，共五十八页。函数迭代法与策略迭代法 ③第二步：由求第三步：由求，类似前面的方法求得第三次策略迭代的结果为管理科学与系统工程第三十一页，共五十八页。 i 1 2 3 4 5 4 5 3 2 11 5 6 5 3 5 5 2 5.5 5 3 5 3 4 5 2 4.5 4 3 5 3 4 5 函数迭代法与策略迭代法 ④将以上结果记录下来：管理科学与系统工程第三十二页，共五十八页。函数迭代法与策略迭代法由以上结果得到，对所有的i都成立，说明迭代步骤可以停止。故找到最优策略为列表表示为从而可以得到各点到靶点(点5)的最优路线和最优距离：管理科学与系统工程 i 1 2 3 4 5 3 4 5 第三十三页，共五十八页。函数迭代法与策略迭代法最优路线最短距离值 ① → ⑤ 2 ② → ③ → ④ → ⑤ 4.5 ③ → ④ → ⑤ 4 ④ → ⑤ 3 可以看到策略迭代法得到的结果与函数迭代法的结果一致。管理科学与系统工程第三十四页，共五十八页。不定期与无期决策过程例2：无限期决策过程模型，状态变换函数为。( 存在明显的级变量，但级数是无限的 ) 管理科学与系统工程第三十五页，共五十八页。函数迭代法与策略迭代法例2的求解（函数迭代法）解：(1)任取初值，如