- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运筹学第六章动态规划运筹学第六章动态规划
第六章 动态规划
主要内容:1、动态规划的基本概念
2、动态规划的最优性原理和基本方程
3、动态规划的模型及其应用
重点与难点:动态规划的状态转移方程、基本方程;动态规划的建模思路与方法;运用递推原理确定最优解的方法与技巧。
要 求:理解动态规划的基本概念,掌握动态规划的建模步骤和求解方法,能够创造性地建立数学模型,并能运用动态规划方法解决实际问题。
§1 动态规划的基本概念
例1 最短线路问题。给定一个运输网络(如图),两点之间的数字表示两点间的距离,试求一条从A0到A4的运输线路,使总距离为最短?
1、阶段
对于一给定的多阶段过程,恰当地分为若干个相互联系的阶段,以便能按一定的次序去求解。描述阶段的变量称为阶段变量,常用K表示。
1)阶段数固定的问题称为定期多阶段决策问题;如例1,可分为四个阶段。
2)阶段数不固定的问题称为不定期多阶段决策问题。如
2、状态
状态表示某阶段的出发位置。它既是某阶段过程演变的起点,又是前一阶段决策的结果。例1中,第一阶段有一种状态即A0点,第二阶段有三个状态,即点集合{A1,B1,C1},一般第K阶段的状态就是第K阶段所有始点的集合。
描述过程状态的变量称为状态变量。第K阶段的状态变量,记为。
3、决策
决策表示当过程处于某一阶段的某个状态时,可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策。描述决策的变量称为决策变量,常用表示处于状态时的决策变量,它是状态变量的函数。
如: , 记为
决策变量可取值的全体,称为允许决策集合。常用表示状态的允许决策集合。如: ,
4、策略
全过程的各个阶段上所选择的决策组成的全体称之为全过程策略,记为。
若为一决策,则全过程策略
由过程的第K阶段开始到终止状态为止的过程,称为问题的后子过程(或K子过程)。其决策函数序列称为k子过程策略,简称子策略,记为。即
在实际问题中,可供选择的策略有一定范围,此范围称为允许策略集合,用P表示。
从允许策略集合中找出达到最优效果的策略称为最优策略。
5、状态转移方程
状态转移方程是确定过程由一个状态到另一个状态的演变过程。它描述了由K阶段到K+1阶段的状态转移规律,称之为状态转移方程,记为。
6、指标函数和最优值函数
用来衡量所实现过程优劣的一种数量指标,称为指标函数。它是定义在全过程和所有后部子过程上确定的数量函数,常用表示。即
动态规划的指标函数,应具有可分离性,并满足递推关系。即
过程和它的任一子过程的指标是它所包含的各阶段的指标和,即 指标函数具有可加性
其中表示第j阶段的阶段指标
上式可写成:
由于给定了过程的初始状态及策略,则指标函数也随之确定,所以指标函数是初始状态和策略的函数,记为, ——子策略
上式也可写成
指标函数的最优值,称为最优值函数,记为,即
§2 基本定理和基本方程
一、最优性原理——作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优策略的子策略总是最优的。这是动态规划的理论基础。
在例1中,如果是的最短路线,则一定是由B1到A4的最短路线。
二、基本方程
§3 动态规划的模型及求解
因为动态规划没有一个标准的数学表达式,所以建立动态规划的模型比它的计算更为困难。
一、建立模型的步骤
(1)选择阶段变量K
按时间或空间的先后顺序将问题划分为满足某种递推关系的若干阶段。
(2)选择状态变量
状态变量应满足可知性和无后效性。可知性是指过程的各阶段状态变量的取值,都能直接或间接的确定;无后效性是指如果某阶段状态给定后,则在这阶段以后过程的发展不受这阶段以前各阶段状态的影响。
通常选择随递推关系累计的量或按某种规律变化的量作为状态变量。
(3)选择决策变量
(4)写出状态转移方程式
(5)列出动态规划的基本方程
二、逆序解法与顺序解法
动态规划的求解有两种基本方法:逆序解法(后向动态规划方法)、顺序解法(前向动态规划方法)。使用上述两种方法求解时,除了求解的行进方向不同外,在建模时要注意以下区别:
1、状态转移方式不同
逆序解法中第k段的输入状态为,决策为,输出状态为,即第k+1阶段的状态,所以状态转移方程为:,阶段指标为 。
顺序解法中第k段的输入状态为,决策为,输出状态为,所以状态转移方程为:,阶段指标为 。
2、指标函数的定义不同
逆序解法中,最优指标函数表示第k段从状态出发,到终点后部子过程最优效益值。是整体最优函数值。
顺序解法中,最优指标函数表示第k段时从起点到状态的前部子过程最优效益值。是整体最优函
文档评论(0)