动态规划.pptVIP

下载本文档

6
0
约1.65千字
约 25页
2017-02-20 发布于上海
举报
版权申诉

动态规划.ppt

1、本文档共25页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态规划

§1.5 动态规划动态规划是一类多阶段决策过程的最优化方法。基本方法是：按阶段把一个大问题化成一系列相互有联系的子问题，建立相应的递推公式，解一系列的子问题，最后求得整个问题的最优解。例最短路问题一、动态规划的基本概念和基本方法 7 11 7 8 4 6 3 4 0 11 1 2 3 4 阶段从A到E的路有：求A到E的最短路。 4 5 7 8 9 10 12 13 1. 概念 ? 阶段：根据时间或空间划分。 ? 状态：某阶段出发的位置。既是某支路本阶段的起点，又是前一阶段的终点。本例按空间分成4个阶段本例4个阶段的状态集： ? 状态变量 sk : 描述状态的变量。 # ? 决策：从给定状态到下一阶段某状态的选择。 ? 决策变量 xk=xk(sk)：描述决策的变量。如：有：容许决策集合 ? 状态转移方程：描述状态转移规律的函数关系 ? 策略：决策序列 2 4 如：本例共有18个策略，欲从中选出最优策略(路长最短者)。 ? k 子策略：策略中，从第k个决策开始到最后一个决策所成之子序列。如： ? 报酬函数: 一决策对应的“费用”，记为如： 2 5 ? 目标（指标）函数：衡量策略好坏的函数。从出发到终点的目标函数记为：视为确定状态，是变化的。 ? 从出发到终点的最优目标值：例中：为A 到E 的最短路程，相应的策略为所求的最优策略— 最短路。对应的策略为到终点最优子策略。 2 6 2. 最优化原理例中：有最优策略即 —A到E的最短路，路长为子策略： — B2到E的最短路，路长为 — C1到E的最短路，路长为 …… 2 7 # 最优策略有性质—最优化原理：无论过去的状态和决策如何，对某确定的状态，余下的决策必须构成最优子策略。或，对某状态而言，该状态到终点的最优策略只与后面的选择有关，与前面的选择无关。或，已知现在，将来与过去无关。即后部子问题的最优策略是父问题的最优子策略。 2 8 # 利用该原理得寻优方法：问题：子问题：行进方向寻优方向先求出“最小子问题”中，各状态到E的最优子策略，将问题化成一系列相互有联系的子问题，再求出“次小子问题”中（第3阶段），各状态到 E的最优子策略，如此向前推进，而每次都利用后部子问题中已得到的最优子策略。如：已得C1到E的最优子策略：在求B2到E的最佳走法时，如果该阶段取 2 9 则后面的最佳走法是：即得最优子策略：在第1阶段，若取，则得A到E的最佳走法：如果是，则利用B1到E的最佳走法得：或 ? 减少了计算量，即不必再验证后面走法的最优性； ? 丰富了结果，即得从任何一点出发到终点的最短路。 2 10 3. 动态规划的数学模型根据最优化原理，可得从出发到终点的最优目标值：例中， 2 11 最短路问题的解（列表）第4阶段：第3阶段： 2 12 第2阶段：第1阶段：最优策略：路长： 2 13 二、应用根据问题的特点，确定：阶段、状态变量、决策变量、状态转移方程、目标函数递推公式。例（例1.7）（生产存储问题）用动态规划方法求解。解假设与例1.7同月份单位成本 (元) 销售量 (件) 按月份分4个阶段；（1）. 建模模型：（2）. 求解 K=4: 故得：关于x4的线性函数欲求Xk,可利用状态转移方程和约束条件，求出xk满足的等式或不等式。 K=3: 求X3: X3的增函数从而得：故 K=2: 可得 K=1: 求X1: 由得总费用：利用状态转移方程及的表达式，按k=1,2,3,4的顺序求最优策略。(d1==60,d2=70,d3=120,d4=60) *