运筹学_动态规划.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 动态规划; 动态规划是运筹学的重要分支之一,它是解决多阶段决策过程最优化的一种方法。该法是由美国数学家R. Bellman等人在上世纪50年代首先提出的。 R.Bellman于1957年发表的“动态规划”一书是动态规划方面的第一本著作。目前,动态规划已成功地用于解决资源分配、货物装运、设备更新、生产计划以及复合系统可靠性等许多问题。;例1.最短路问题;上述问题的特点: 问题可以分解为多个决策阶段。 多阶段决策问题可以表示为:;动态规划的基本特征: 研究对象:多阶段的决策问题 研究目标:达到整个活动过程的总体最优 适用范围:阶段状态具有无后效性 (后文介绍); 多阶段决策问题是指一类活动过程,它可以分为若干个相互联系的阶段,在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益,而且决定下一阶段的初始状态。 每个阶段的决策确定以后,就得到一个决策序列,称为策略。多阶段决策问题就是求一个策略,使各阶段的效益的总和达到最优。;动态规划基本概念;状态(State) 状态表示每个阶段开始时所处的自然状况或客观条件,它描述了影响决策的因素随决策进程的变化情况,它既是前面阶段所作决策的结果,又是本阶段作出决策的出发点和依据。 描述各个阶段状态的变量称为状态变量,通常第k阶段的状态变量用sk表示,状态变量sk取值的集合用Sk表示。 见下面的例子。;A;状态的无后效性(马尔科夫性) 在动态规划中,当某一阶段状态给定以后,在这一阶段以后过程的发展就不受这一阶段以前各阶段状态的影响。 即当某阶段的状态给定时,这个阶段以后过程的演变与该阶段以前的历史状态无关。 过程过去的历史只能通过当前状态去影响他的未来,称为无后效性(马尔科夫性);决策(decision) 当某阶段的状态确定以后,就可以通过做出不同的决定来确定下一阶段的状态,这种决定就称为是决策。 描述决策的变量称为决策变量,它的取值决定系统下一阶段处于哪个状态,通常用xk(sk)表示第k阶段当状态处于sk时的决策变量,是状态变量的函数。 在实际问题中决策变量的取值往往被限定在一定的范围内,称为允许决策的集合,通常用Dk(sk)表示第k阶段从sk出发的允许决策的集合。 见如下例子。;例2中,从第2阶段B2出发可以选择C2, C3 , C4 , 允许决策的集合为 D2(B2)= {C2 ,C3 , C4},如果选择C2则 x2(B2)= C2;策略(Strategy) 由过程的第一阶段开始到最后一阶段为止称为问题的全过程,由各阶段的决策构成的策略序列称为全过程策略,记为P1n。 ; 后部子过程 由多阶段决策过程的第k个阶段开始到终止状态为止的过程称为后部子过程,由第k阶段开始的决策按照顺序排列组成的决策序列 ;状态转移方程 状态转移方程是确定过程由一个状态转移到另一个状态的演变过程。 如果给定第k阶段的状态变量sk的值,那么这一阶段的决策变量xk一经确定,第k+1阶段的状态变量也就确定了,即sk+1的值随sk和xk的变化而变化,记作 sk+1 =T(sk, xk) (1) (1)表示由k阶段到k+1阶段的状态转移规律,称为状态转移方程。;阶段指标(损益)函数 阶段指标函数是对某一阶段的状态和决策产生的效益值的度量。第j阶段的阶段指标函数通常用dj =dj (sj, xj)表示 指标函数(策略效益) 指标函数是用来衡量所实现过程优劣的一种数量指标,它是定义在全过程或者所有后部子过程上的确定的数量函数,它是用来衡量所实现过程好坏的数量指标,用Fkn表示 Fkn =Fkn (sk, xk , sk+1, xk+1 ,‥‥,sn, xn , sn) 针对最短路问题分别分析上述两个指标的含义。;定义在全过程上的指标函数相当于目标函数,一般记为F1n 动态规划所要求的过程指标函数应具有可分离性,即可表达为它所包含的各阶段指标函数的函数形式。常见的两种过程指标函数形式是: ;最优子策略指标函数值 把过程指标函数Fkn对k子过程策略Pkn求最优,得到一个关于状态sk的函数,称为最优值函数记为: fk (sk) 在例2中,Fkn表示在第k阶段由sk到终点G的距离, fk (sk)表示sk到终点G的最短距离 ;A;最优性原理; 将多阶段的决策过程划分为不同阶段,恰当地选取状态变量、决策变量并定义最优指标函数,正确写出基本的递推关系和恰当的边界条件。 求解时从边界条件开始,逆过程进行方向逐段递推寻优,在对每一个子问题进行求解时,都要使用前面已求出的子问题的最优结果,最后一个子问题的最优解就是整个问题的最优解。 动态规划方法每一阶段最优决策选取是从全局考虑的,与该阶段的最优决策一般是不同的。;A;建立动

文档评论(0)

xx88606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档