- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[55动态规划
第五章 动态规划
§5.1 动态规划的基本概念和方法
§5.2 动态规划的基本原理﹑模型和解法
§5.3 前向动态规划法
§5.4 动态规划的应用
Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.
5.1.1多阶段决策及过程最优化
§5.1 动态规划的基本概念和方法
Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.
动态规划是现代管理中一种重要的决策方法,它可以广泛地用于解决最短路径问题、资源分配问题、生产计划与库存问题、投资问题、装载问题、排序问题及生产过程的最优控制等。由于它具有独特的解题思路因此在处理某些优化问题时常比线性规划等方法更为有效。
动态规划模型一般根据决策过程的时间参数是离散的还是连续的过程的演变是确定型的还是随机型的可以划分为离散确定型、离散随机型、连续确定型和连续随机型四种类型,其中离散确定型是最基本的。
Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.
例5.1 设A地的某一企业要把一批货物由A地运到E城销售, 其间要经过八个城市,各城市间的交通路线及距离如图5.1所示, 问应选择什么路线才能使总的距离最短?
图5.1 例5.1路线图(共18条路线,3×3×2×1=18)
Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.
这是一个最短路径问题的动态规划,也叫车马驿站问题。由图5.1 不难看出, 本例是一个四阶段的决策问题, 因此, 无疑可以用动态规划方法求解。
5.1.2 动态规划的基本概念
一、阶段(stage)
将所给问题的过程,按时间或空间特征分解成若干相互联系的段落以便按次序求解就形成了阶段,阶段变量常用字母k来表示。
如例5.1若有四个阶段,k就等于1,2,3,4。第一阶段共有3 条路线即(A,B1), (A,B2)和(A,B3),第二阶段有9条路线,第3 阶段有6条路线,第4 阶段有2 条路线。
Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.
二、状态(state)
各阶段开始时的客观条件或出发点称作状态,描述各阶段状态的变最称作状态变量, 用s表示。状态变量的取值集合称为状态集合, 用S表示。在例5.1中,第一阶段的状态为A,第二阶段的状态为城市B1,B2和B3。所以状态变量s1的集合S1={A},s2的集合是S2={B1,B2,B3}, 依次有S3={C1,C2,C3}, S4={D1,D2}。所以,在这里,状态变量的取值实际上是给定集合的一个元素。
在动态规划中,状态必须具有如下性质:即当某阶段状态给定以后,在这阶段以后过程的发展不受这段以前各状态的影响 , 这称作无后效性。如果所选定的变量不具备无后效性,就不能作为状态变量来构造动态规划模型。如在例5.1中,当某阶段的状态变量确定以后,假定s3=C2,因而在确定第3 阶段的货运路线时,就只与C2 这个城市有关,而与货物由哪个城市到达此地无关,所以满足状态的无后效性。
Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.
三、决策和策略(Decision and Policy)
当各阶段的状态确定以后,就可以做出不同的决定或选择,从而确定下一阶段的状态,这种决定就是决策。表示决策的变量称为决策变量,常用Uk(Sk)表示第k阶段当状态为Sk时的决策变量。在实际问题中,决策变量的取值是被限制在一定的范围内,我们称此范围为允许的决策集合,用D
文档评论(0)