[10动态规划1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[10动态规划1

练习:P211 习题8.2 5.1 逆序(递推)法 设已知初始状态s1,最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。 具体方法如下: 当阶段k=n时 即 其中s表示状态,x表示决策(控制) 可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 当阶段k=n-1时 其中状态转移方程 得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。 当阶段k=k时 其中状态转移方程 得最优决策xk=xk(sk)和最优值fk(sk)。 如此类推,直到第一阶段。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 当阶段k=1时 其中状态转移方程 得最优决策x1=x1(s1)和最优值f1(s1)。 由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去,就可逐步确定出每阶段的决策及效益。 例1 用动态规划的逆序法求解下面问题 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 解: 分阶段:(按照问题的变量个数划分阶段)分三个阶段,即k=1,2,3。 确定决策变量:通常可以取问题中的变量为决策变量。 确定状态变量:状态变量与决策变量有密切关系,状态变量一般为累计量 或随递推过程变化的量。 指标函数 最优指标函数 fk(sk)=maxVk,3 状态转移方程 决策变量 边界条件 f4(s4)=1 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 基本方程 当阶段k=3时,有 当阶段k=2时,有 得最优决策 最优目标函数 有两个解,其中x2=0舍去。 因2阶导数在x*2处小于0,故有极大值。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. * 动态规划(Dynamic Programming) 动态规划是美国数学家Bellman创立的。是解决复杂系统优化问题的一种方法。是解决动态系统多阶段决策过程的基本方法之一。 R Bellman50年代执教于普林斯顿和斯坦福大学,后进入兰德(Rand)研究所。1957年发表“Dynamic Programming”一书,标志动态规划的正式诞生。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 动态系统:包含随时间变化的因素和变量的系统。包含:线性系统、非线性系统。 动态系统的特点:系统在某个时刻的状态,往往要依某种形式受过去某些决策的影响,而系统的当前状态和决策又会影响系统过程今后的发展。 动态决策问题:将时间作为决策变量之一的决策问题称为动态决策问题。 动态决策问题的特点:在动态决策问题中,系统所处的状态和时刻是进行决策的重要因素,即在系统发展的不同时刻(或阶段)根据系统所处的状态,不断地做出决策,找到不同时刻的的最优决策以及整个过程的最优策略。 第一节:动态规划的研究对象和引例 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 多阶段决策问题:

文档评论(0)

19840506 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档