第3节动态规划的最优性原理和最优性定理动态规划的最优性原理.PPT

下载文档 降价啦

612
0
约8.32千字
约 61页
2019-07-06 发布于天津
举报
版权申诉
保障服务

第3节动态规划的最优性原理和最优性定理动态规划的最优性原理.PPT

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

2.2 动态规划的基本思想和基本方程动态规划的方法比穷举法有以下优点： (1) 减少了计算量。计算例1若用穷举法，就要对48条路线进行比较，运算在计算机上进行时，比较运算要进行47次；求各条路线的距离，即使用逐段累加方法，也要进行6+12+24+48+48＝138次加法运算。用动态规划方法来计算，比较运算(从k=5段开始向前算)共进行3+3+4+4+1＝15次。每次比较运算相应有两次加法运算，再去掉中间重复两次(即B1→C1，B2→C4各多算了一次)，实际只有28次加法运算。可见，动态规划方法比穷举法减少了计算量。而且随着段数的增加，计算量将大大地减少。 (2) 丰富了计算结果。在逆序(或顺序)解法中，我们得到的不仅仅是由A点(或G点)出发到G点(或A点)的最短路线及相应的最短距离，而且得到了从所有各中间点出发到G点(或A点)的最短路线及相应的距离。这就是说，求出的不是一个最优策略，而是一族的最优策略。清华大学出版社 * 2.2 动态规划的基本思想和基本方程建立动态规划模型的五个要点： (1) 将问题的过程划分成恰当的阶段； (2) 正确选择状态变量sk，使它既能描述过程的演变，又要满足无后效性； (3) 确定决策变量uk及每阶段的允许决策集合Dk(sk)； (4) 正确写出状态转移方程； (5) 正确写出指标函数Vk,n的关系，它应满足下面三个性质： ① 是定义在全过程和所有后部子过程上的数量函数； ② 要具有可分离性，并满足递推关系。即 ③ 函数对于变量Vk+1,n要严格单调。清华大学出版社 * 2.2 动态规划的基本思想和基本方程下面考虑动态规划基本方程。设指标函数是取各阶段指标的和的形式，即其中表示第j段的指标。它显然是满足指标函数三个性质的。所以上式可写成当初始状态给定时，过程的策略就被确定，则指标函数也就确定了。因此，指标函数是初始状态和策略的函数。可记为。清华大学出版社 * 2.2 动态规划的基本思想和基本方程上面递推关系又可写成其子策略可看成是由决策和组合而成。即如果用p*k,n(sk)表示初始状态为sk的后部子过程所有子策略中的最优子策略，则最优值函数为而清华大学出版社 * 2.2 动态规划的基本思想和基本方程所以，得到动态规划逆序解法的基本方程：边界条件为但式中求解过程，根据边界条件，从k=n开始，由后向前逆推，从而逐步可求得各段的最优决策和相应的最优值，最后求出时，就得到整个问题的最优解。清华大学出版社 * 2.2 动态规划的基本思想和基本方程动态规划顺序解法的基本方程边界条件为式中求解过程：根据边界条件，从k=1开始，由前向后顺推，逐步求得各段的最优决策和相应的最优值，最后求出，就得到整个问题的最优解。清华大学出版社 * 第3节动态规划的最优性原理和最优性定理动态规划的最优性原理： “作为整个过程的最优策略具有这样的性质：即无论过去的状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。” 简言之，一个最优策略的子策略总是最优的。动态规划的基本方程或者说最优性定理才是动态规划的理论基础清华大学出版社 * 第3节动态规划的最优性原理和最优性定理动态规划的最优性定理：设阶段数为n的多阶段决策过程，其阶段编号为 k=0，1，…，n-1 允许策略为最优策略的充要条件是对任意一个k 有式中，它是由给定的初始状态s0和子策略所确定的k段状态。当V是效益函数时，opt取max；当V是损失函数时，opt取min。清华大学出版社 * 第4节动态规划和静态规划的关系相同点动态规划、线性规划和非线性规划都属于数学规划范围，研究对象本质上都是求极值问题，都是利用迭代法去逐步求解。不同点线性规划和非线性规划研究的问题通常与时间无关，故又称为静态规划。线性规划迭代中的每一步是就问题的整体加以改善的。动态规划研究的问题与时间有关，研究具有多阶段决策过程的一类问题，将问题的整体按时间或空间的特征分成若干个前后衔接的时空阶段，把多阶段决策问题表示为前后有关联的一系列单阶段决策问题，然后逐个加以解决，从而求出整个问题的最优决策序列。对于某些静态问题，也可以人为地引入时间因素，把它看作是按阶段进行的一个动态规划问题，这就使得动态规划成为求解某些线性、非线性规划的有效方法。清华大学出版社 * 第4节动态规划和静态规划的关系动态规划方法逆序解法顺序