动态规划MATLab.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动态规划MATLab

* 案例:最短路问题 假设要从A城市到 E城市铺设一条输油管道, 中间需要经过三个地区, 每个地区都有若干个转运 站, 构成了许多不同的输油路线, 转运站间的数字 表示站间的运输路径的长度, 由于地理条件等原因, 某些地区之间不能直接铺设相通的管道。 现需求出 一条使总路径最短的管道路线。 动态规划 A B1 B2 B3 C1 C2 C3 D1 D2 E 1 动态规划的基本概念 一、 阶段 对于一个多阶段决策过程, 可以根据问题的特 点, 把整个过程划分为几个相互联系的阶段, 以便 可以按一定的顺序去求解。 这个根据时间和空间的 自然特征来划分的次序称为阶段, 描述阶段的变量 称为阶段变量, 一般用k表示。 如案例中的多阶段决策问题可划分为四个阶 记为 段, 二、状态 状态:表示系统每个阶段开始时所处的自然状况或 客观条件。 如案例中, 状态就是某阶段的出 发位置, 它既是该阶段某支路的起点, 又是前 一阶段某支路的终点。 第一个阶段有一个状态 即为点A, 第二个阶段有三个状态 状态变量:描述状态的变量。常用 表示第k阶段 的状态变量。 如案例中第三个阶段有3个状 态, 则状态 可取三个值, 即 这三 个点构成的集合 称为第三个阶段 的允许状态集, 记为 有时为了方 便起见, 也将阶段的状态编上号码 即有 一般地, 第 k个阶段的允许状态集 记为 当某个阶段的状态给定后, 则这个阶段以后过程 的发展不受这个阶段及以前各阶段状态的影响。也 是说,当前的状态只是以往历史的一个总结,过程 的过去历史只能通过当前的状态去影响它未来的发 展,这种性质称为无后效性。 三、决策 决策: 各阶段状态确定后, 确定下一个阶段的状态 的各种选择。 决策变量: 描述决策的变量。 常用 表示第k 阶段状态处于 时的决策变量,它是状态 变量 的函数。 允许决策集: 决策变量的取值构成的集合, 表明决策 的约束条件, 常用 表示第k阶段系统 处于状态 时的允许决策集合, 即有 如案例中, 第二阶段决策时,若从状 态 出发, 则可做出三种不同决策,其允许决策集 合为 若选定的下一个状态是 则 四、策略 策略: 从初始阶段到最终阶段, 每个阶段均有一决 策, 各阶段决策形成一个决策序列, 称为系统的一个策略。 此序列 最优策略: 使系统达到最优效果的策略。 全过程策略: 对于具有几个阶段的多阶段决策问题, 从第一个阶段的某一状态出发到终止阶 段的状态做出的决策序列而形成的策略。 记为 即 k后部子过程: 从第k阶段到终止阶段状态的过程。简 称为 k子过程。 后部子过程策略: k后部子过程相应的决策序列 。简 称为 k子策略。 记为 即 允许策略集: 在实际问题中,可供选择的策略所在 的范围,常记为 P。 五、状态转移方程 状态转移方程: 描述系统由一个阶段到下一个阶段 的状态转移规律。 例如,设系统第k阶段的 状态变量 的值给定, 该阶段的决策变量 确定, 则第k+1阶段 的状态变量 的值 也就确定了, 即 的值随 和 变化而变化,这种对应关系我们记为 的值的 以上状态转移规律,即为状态转移方程。 称为状态转移函数。 六、指标函数与最优指标函数 k阶段指标函数: 第k阶段状态为 决策变量 取 某个值后得到的一个反映这个局部策略效 应的数量指标。 也称为k阶段的效应函数 。 全过程的指标函数: 常用 表示 。 采用全过程的策略 的数量 指标。 其指标函数值记为 用 表示第k阶段状态为 采用 策略 时,后部子过程的指标函数值。 最优指标函数: 指标函数的最优值。 记为 表示从第k阶段的状态 开始到第 n 阶段 的终止过程采取最优策略 所得到的 指标函数值,即 在不同问题中, 指标函数的含义是不同的, 它可能指 距离、利润、成本、产品的产量或资源消耗等。 如 案例中, 指标函数是距离, 如第二阶段状态为 时, 表示由 出发采用决策到下一个 阶段 点的距离, 表示从 出发到F的总 距离, 而 表示从B1 出发到F的最短距离。 该问 题的总目标是求 即从A到终点F的最短距离。 2 动态规划的基本原理 下面我们结合案例的最短路问题来介绍动态 规划的基本思想与基本原理。 穷举法的计算量将非常大,显然不适合。 考虑最短路线的一个重要特征: 若从起点A经过 B点和C点而达到终点 D是一条最短路线, 则由B点出 发经过C点到达终点D点

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档