- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章动态规划; 动态规划是运筹学的重要分支之一,它是解决多阶段决策过程最优化的一种方法。该法是由美国数学家R. Bellman等人在上世纪50年代首先提出的。
R.Bellman于1957年发表的“动态规划”一书是动态规划方面的第一本著作。目前,动态规划已成功地用于解决资源分配、货物装运、设备更新、生产计划以及复合系统可靠性等许多问题。;例1.最短路问题;上述问题的特点:
问题可以分解为多个决策阶段。
多阶段决策问题可以表示为:;动态规划的基本特征:
研究对象:多阶段的决策问题
研究目标:达到整个活动过程的总体最优
适用范围:阶段状态具有无后效性 (后文介绍);
多阶段决策问题是指一类活动过程,它可以分为若干个相互联系的阶段,在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益,而且决定下一阶段的初始状态。
每个阶段的决策确定以后,就得到一个决策序列,称为策略。多阶段决策问题就是求一个策略,使各阶段的效益的总和达到最优。;动态规划基本概念;状态(State)
状态表示每个阶段开始时所处的自然状况或客观条件,它描述了影响决策的因素随决策进程的变化情况,它既是前面阶段所作决策的结果,又是本阶段作出决策的出发点和依据。
描述各个阶段状态的变量称为状态变量,通常第k阶段的状态变量用sk表示,状态变量sk取值的集合用Sk表示。
见下面的例子。;A;状态的无后效性(马尔科夫性)
在动态规划中,当某一阶段状态给定以后,在这一阶段以后过程的发展就不受这一阶段以前各阶段状态的影响。
即当某阶段的状态给定时,这个阶段以后过程的演变与该阶段以前的历史状态无关。
过程过去的历史只能通过当前状态去影响他的未来,称为无后效性(马尔科夫性);决策(decision)
当某阶段的状态确定以后,就可以通过做出不同的决定来确定下一阶段的状态,这种决定就称为是决策。
描述决策的变量称为决策变量,它的取值决定系统下一阶段处于哪个状态,通常用xk(sk)表示第k阶段当状态处于sk时的决策变量,是状态变量的函数。
在实际问题中决策变量的取值往往被限定在一定的范围内,称为允许决策的集合,通常用Dk(sk)表示第k阶段从sk出发的允许决策的集合。
见如下例子。;例2中,从第2阶段B2出发可以选择C2, C3 , C4 , 允许决策的集合为
D2(B2)= {C2 ,C3 , C4},如果选择C2则 x2(B2)= C2;策略(Strategy)
由过程的第一阶段开始到最后一阶段为止称为问题的全过程,由各阶段的决策构成的策略序列称为全过程策略,记为P1n。
; 后部子过程
由多阶段决策过程的第k个阶段开始到终止状态为止的过程称为后部子过程,由第k阶段开始的决策按照顺序排列组成的决策序列
;状态转移方程
状态转移方程是确定过程由一个状态转移到另一个状态的演变过程。
如果给定第k阶段的状态变量sk的值,那么这一阶段的决策变量xk一经确定,第k+1阶段的状态变量也就确定了,即sk+1的值随sk和xk的变化而变化,记作
sk+1 =T(sk, xk) (1)
(1)表示由k阶段到k+1阶段的状态转移规律,称为状态转移方程。;阶段指标(损益)函数
阶段指标函数是对某一阶段的状态和决策产生的效益值的度量。第j阶段的阶段指标函数通常用dj =dj (sj, xj)表示
指标函数(策略效益)
指标函数是用来衡量所实现过程优劣的一种数量指标,它是定义在全过程或者所有后部子过程上的确定的数量函数,它是用来衡量所实现过程好坏的数量指标,用Fkn表示
Fkn =Fkn (sk, xk , sk+1, xk+1 ,‥‥,sn, xn , sn)
针对最短路问题分别分析上述两个指标的含义。;定义在全过程上的指标函数相当于目标函数,一般记为F1n
动态规划所要求的过程指标函数应具有可分离性,即可表达为它所包含的各阶段指标函数的函数形式。常见的两种过程指标函数形式是:
;最优子策略指标函数值
把过程指标函数Fkn对k子过程策略Pkn求最优,得到一个关于状态sk的函数,称为最优值函数记为: fk (sk)
在例2中,Fkn表示在第k阶段由sk到终点G的距离, fk (sk)表示sk到终点G的最短距离
;A;最优性原理;
将多阶段的决策过程划分为不同阶段,恰当地选取状态变量、决策变量并定义最优指标函数,正确写出基本的递推关系和恰当的边界条件。
求解时从边界条件开始,逆过程进行方向逐段递推寻优,在对每一个子问题进行求解时,都要使用前面已求出的子问题的最优结果,最后一个子问题的最优解就是整个问题的最优解。
动态规划方法每一阶段最优决策选取是从全局考虑的,与该阶段的最优决策一般是不同的。;A;建立动
您可能关注的文档
最近下载
- 《天上有颗南仁东星》第二课时 课件 八年级语文上册 统编版.pptx VIP
- 新人教版高中物理必修三第十一章《电路及其应用》测试题(含答案解析).docx VIP
- 14、圆明园的毁灭(课件)第二课时2023-2024学年五年级上册语文(统编版) (1).pptx VIP
- 北师大版四年级数学上册第三单元《乘法》(大单元教学设计).docx VIP
- 同上一堂党课初中篇 中流砥柱观后感五.doc VIP
- 最新2016-2017学年秋季学期人美版小学六年级上册美术教案全册.doc VIP
- 《互联网》精品课件.pptx VIP
- 浙江维思通新材料有限公司年产 20000 吨锂电池新型材料项目环评报告.docx VIP
- BIM基础培训教材课件.pptx VIP
- 管理学:激励PPT教学课件.pptx
文档评论(0)