动态规划MATLab.pptVIP

下载本文档

6
0
约3.18千字
约 31页
2017-08-06 发布于浙江
举报
版权申诉

动态规划MATLab.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态规划MATLab

* 案例：最短路问题假设要从A城市到 E城市铺设一条输油管道，中间需要经过三个地区，每个地区都有若干个转运站，构成了许多不同的输油路线，转运站间的数字表示站间的运输路径的长度，由于地理条件等原因，某些地区之间不能直接铺设相通的管道。现需求出一条使总路径最短的管道路线。动态规划 A B1 B2 B3 C1 C2 C3 D1 D2 E 1 动态规划的基本概念一、阶段对于一个多阶段决策过程，可以根据问题的特点，把整个过程划分为几个相互联系的阶段，以便可以按一定的顺序去求解。这个根据时间和空间的自然特征来划分的次序称为阶段，描述阶段的变量称为阶段变量，一般用k表示。如案例中的多阶段决策问题可划分为四个阶记为段，二、状态状态：表示系统每个阶段开始时所处的自然状况或客观条件。如案例中，状态就是某阶段的出发位置，它既是该阶段某支路的起点，又是前一阶段某支路的终点。第一个阶段有一个状态即为点A，第二个阶段有三个状态状态变量：描述状态的变量。常用表示第k阶段的状态变量。如案例中第三个阶段有3个状态，则状态可取三个值，即这三个点构成的集合称为第三个阶段的允许状态集，记为有时为了方便起见，也将阶段的状态编上号码即有一般地，第 k个阶段的允许状态集记为当某个阶段的状态给定后，则这个阶段以后过程的发展不受这个阶段及以前各阶段状态的影响。也是说，当前的状态只是以往历史的一个总结，过程的过去历史只能通过当前的状态去影响它未来的发展，这种性质称为无后效性。三、决策决策：各阶段状态确定后，确定下一个阶段的状态的各种选择。决策变量：描述决策的变量。常用表示第k 阶段状态处于时的决策变量，它是状态变量的函数。允许决策集：决策变量的取值构成的集合，表明决策的约束条件，常用表示第k阶段系统处于状态时的允许决策集合，即有如案例中，第二阶段决策时，若从状态出发，则可做出三种不同决策，其允许决策集合为若选定的下一个状态是则四、策略策略：从初始阶段到最终阶段，每个阶段均有一决策，各阶段决策形成一个决策序列，称为系统的一个策略。此序列最优策略：使系统达到最优效果的策略。全过程策略：对于具有几个阶段的多阶段决策问题，从第一个阶段的某一状态出发到终止阶段的状态做出的决策序列而形成的策略。记为即 k后部子过程：从第k阶段到终止阶段状态的过程。简称为 k子过程。后部子过程策略： k后部子过程相应的决策序列。简称为 k子策略。记为即允许策略集：在实际问题中，可供选择的策略所在的范围，常记为 P。五、状态转移方程状态转移方程：描述系统由一个阶段到下一个阶段的状态转移规律。例如，设系统第k阶段的状态变量的值给定，该阶段的决策变量确定，则第k+1阶段的状态变量的值也就确定了，即的值随和变化而变化，这种对应关系我们记为的值的以上状态转移规律，即为状态转移方程。称为状态转移函数。六、指标函数与最优指标函数 k阶段指标函数：第k阶段状态为决策变量取某个值后得到的一个反映这个局部策略效应的数量指标。也称为k阶段的效应函数。全过程的指标函数：常用表示。采用全过程的策略的数量指标。其指标函数值记为用表示第k阶段状态为采用策略时，后部子过程的指标函数值。最优指标函数：指标函数的最优值。记为表示从第k阶段的状态开始到第 n 阶段的终止过程采取最优策略所得到的指标函数值，即在不同问题中，指标函数的含义是不同的，它可能指距离、利润、成本、产品的产量或资源消耗等。如案例中，指标函数是距离，如第二阶段状态为时，表示由出发采用决策到下一个阶段点的距离，表示从出发到F的总距离，而表示从B1 出发到F的最短距离。该问题的总目标是求即从A到终点F的最短距离。 2 动态规划的基本原理下面我们结合案例的最短路问题来介绍动态规划的基本思想与基本原理。穷举法的计算量将非常大，显然不适合。考虑最短路线的一个重要特征：若从起点A经过 B点和C点而达到终点 D是一条最短路线，则由B点出发经过C点到达终点D点