- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
七章节 动态规划
第七章 动态规划; 动态规划(D.P.– Dynamic Program)是解决多阶段决策过程最优化问题的一种方法。
广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。
动态的含义:
动态规划方法与“时间”关系很密切,随着时间过程的发展而决定各时段的决策,产生一个决策序列,这就是“动态”的意思。;动态规划的起源:
1951年,(美)数学家R.Bellman等人,根据多阶段序贯决策问题的特点,提出了著名的“最优性原理”。将多阶段决策问题转变为一系列的互相联系的单阶段决策问题,然后,逐个阶段予以解决,最后再形成总体解决。从而创建了求解优化问题的新方法——动态规划。1957年,他的名著《动态规划》出版。
最优性原理:
作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优子策略。简言之,最优策略的子策略总是最优的。;动态决策问题:
决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。
动态决策问题分类:
1、按数据给出的形式分为:
? 离散型动态决策问题。
? 连续型动态决策问题。
2、按决策过程演变的性质分为:
? 确定型动态决策问题。
? 随机型动态决策问题。 ;例1 生产与存贮问题
要求确定一个逐月的生产计划,在满足需求条件下,使一年的生产与存贮费用之和最小?
例2 投资决策问题
某公司现有资金Q万元,在今后5年内考虑给A,B,C,D 4个项目投资?
例3 设备更新问题
现企业要决定一台设备未来8年的更新计划,问应在哪些年更新设备可使总费用最小? ;例4 基建投资问题
一家公司有三个工厂,每个厂都需要进行扩建。公司用于扩建的资金总共为7万元。各个厂的投资方案及扩建后预期可获得的利润如表所示(单位:万元)。;例5 货船装运问题
有四种货物准备装到一艘货船上。第i(i=1.2,3,4)种货物的每一箱重量是wi(单位:吨),其价值是vi(单位:干元),如表所示。;例6 最短路程问题
假定从A地到E地要铺设一条管道,其中要经过若干个中间点(如图)。;二、基本概念和基本原理;2、状态:各阶段开始时的客观条件叫做状态。
状态变量:描述各阶段状态的变量,用sk表示第k阶段的状态变量。
状态集合:状态变量的取值集合,用Sk表示。;3、决策:当各段的状态取定以后,就可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策。
决策变量:表示决策的变量,称为决策变量,常用uk(sk)表示第k阶段当状态为sk时的决策变量。
允许决策集合:决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合,用Dk(sk)表示第k阶段从状态sk出发的允许决策集合。;策略:各段决策确定后,整个问题的决策序列就构成一个策略,用p1,n{u1(s1),u2(s2),...un(sn)}表示。
允许策略集合:对每个实际问题,可供选择的策略有一定范围,称为允许策略集合,记作P1,n,使整个问题达到最优效果的策略就是最优策略。; 4、状态转移方程:动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。
第k段的状态sk,本阶段决策为uk(sk),则第k+1段的状态sk+1也就完全确定,它们的关系可用公式表示:sk+1=Tk(sk,uk); 5、指标函数:用于衡量所选定策略优劣的数量指标。
它分为阶段指标函数和过程指标函数。
阶段指标函数是指第k段,从状态sk出发,采取决策uk时的效益,用d(sk,uk)表示。d(B1,C2)
一个n段决策过程,从1到n叫作问题的原过程,对于任意一个给定的k(1≤k ≤ n),从第k段到第n段的过程称为原过程的一个后部子过程。
V1,n(s1,p1,n) 表示初始状态为s1采用策略p1,n时原过程的指标函数值;
Vk,n(sk,pk,n)表示在第k段,状态为sk采用策略pk,n时,后部子过程的指标函数值。
最优指标函数记为fk(sk):表示从第k段状态sk采用最优策略到过程终止时的最佳效益值。;最简单的方法--穷举法。共有多少条路径,依次计算并比较。
动态规划方法--本方法是从过程的最后一段开始,用逆序递推方法求解,逐步求出各段各点到终点的最短路线,最后求得起始点到终点的最短路线。;2;2;2;2;2;2;2;2;2;2;
文档评论(0)