网站大量收购独家精品文档,联系QQ:2885784924

[工学]第四章:动态规划.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]第四章:动态规划

第四章 动态规划 4.1 动态决策问题 4.2 动态规划的基本概念 4.3 最优化原理 4.4 动态规划(DP)问题建模及求解 4.1 动态决策问题 动态决策问题是决策过程具有阶段性或时序性的决策问题。即决策过程可划分为明显的阶段决策问题。 决策过程的分类:根据过程的时间变量是离散的还是连续的,分为离散时间决策过程(discrete-time decision process)和连续时间决策过程(continuous-time decision process),对应的决策问题分为离散型动态决策问题和连续型动态决策问题; 根据过程的演变是确定的还是随机的,分为确定型决策过程(deterministic decision process)和随机型决策过程(stochastic decision process),按决策过程演变的性质分为:确定型动态决策问题和随机型动态决策问题。其中应用最广的是确定型动态(多阶段)决策问题。 “动态”一词强调决策过程及其解决的问题具有时间上的顺序特性。 4.2 动态规划的基本概念 动态规划(dynamic programming,简称:DP)是运筹学的一个分支,是求解多阶段决策问题的最优化方法。20世纪50年代初,美国数学家R. E. Bellman等人在研究多阶段决策过程(multi-step decision process)的优化问题时,提出了著名的最优性原理(principle of optimality),即把多阶段决策过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法 — 动态规划,并于1957年出版了他的名著《Dynamic Programming》。 动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如:最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。 虽然动态规划主要用于求解以时间来划分阶段的动态过程优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段的决策过程,也可以用动态规划方法方便地求解。 应当指出,动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而,它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析。因此,在学习时,除了要对基本概念和方法正确理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。 这是动态规划的一大弱点,另一弱点是“维数障碍”。 下面以最短路线问题为例,说明动态规划的基本概念。 例4-1:最短路线问题:下面是一个线路网,连线上的数字表示两点之间的距离(或费用)。试寻求一条由A到F 距离最短(或费用最省)的路线。 4.3 最优化原理 一、R.E.Bellman最优化原理 Bellman等人研究了有如例4-1的这样一类问题,得出了动态规划最优化原理: “作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对于前面的决策所形成的状态而言,余下的诸决策必构成最优策略。” 即:若M是从A到B最优路线上的任一点,则从M到B的路线也是最优路线。 4.4 动态规划(DP)问题建模及求解 一、建模条件 决策过程本身具有时序性或可以转化为具有时序性的决策问题,均可建立动态规划 数学模型求解。 例4-2:某公司有一扩建工程,分四期完成,巳获贷款10万元,经研究,每期可朝以下三种方案选一种 方案,实现各方案所需时间及资金估算如下表。问:在预定资金限制条件下,每期采用哪种方案,使整 个扩建工期最短? 2、资源分配问题 某种资源总量为a,用于生产n种产品,若分配数量Xi用于生产第i种产品,收益为gi(Xi)。 问:如何分配才使总收益最大? 3、背包问题 4、生产与存储问题 * A B1 B2 B3 C1 C2 C3 D1 D2 D3 E1 E2 F 3 5 4 9 5 4 3 5 1 7 1 5 8 4 6 4 4 2 2 2 6 9 7 5 1 4 一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素: 1. 阶段(stage)n:对整个决策过程的自然划分,即作出决策的若干轮次。如上例n = 1,

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档