[运筹学——动态规划.pptVIP

下载本文档

1
0
约 80页
2018-04-15 发布于北京
举报
版权申诉

[运筹学——动态规划.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

[运筹学mdash;mdash;动态规划[运筹学mdash;mdash;动态规划[运筹学mdash;mdash;动态规划

Yunchouxue 第七章动态规划 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 以最短路问题为例，来说明动态规划的概念 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 一、动态规划基本概念： 1、阶段: 将所要研究的问题,按时间或空间特征分成若干个互相联系的阶段.简称“阶段”。阶段就是作出决策的若干轮次。描述阶段的变量叫阶段变量，常用k表示阶段变量.上例中k＝1，2，3，4，5。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 2、状态及性质各阶段开始时的客观条件叫做状态.描述各阶段状态的变量叫做状态变量,常用sk表示第ｋ阶段的状态变量, sk的取值集合称为状态集合,用Sk表示。阶段的出发位置，即阶段的起点。上例中，第二阶段有两个状态，即Sk= {B1,B2} 动态规划中状态具有以下性质:某阶段状态一旦确定,以后过程的状态变化不受这个状态以前的影响,也就是说某状态以后的过程和以前无关,只与当前状态有关,我们称这种特性为“无后效性.”(即马尔科夫性。）P194 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 3、决策和策略指从一个阶段某状态演变到下一阶段某状态的选择（决定）称为决策。表示决策的变量叫做决策变量,常用uk(sk)表示.第k阶段当状态为sk时的决策变量. 在实际问题中决策变量的取值往往限制在一定的范围内,我们称此范围为允许决策集,常用Dk(sk)表示第k阶段从状态sk出发的允许决策集,因此有uk(sk) ∈Dk(sk). 在例1中D2(B1)={C1,C2,C3} . Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 策略在例1中 D2(B1)={C1,C2,C3}.表示什么？表示从第二阶段的状态B1出发，可选择下一阶段的{C1 ,C2,C3}。即允许决策集是D2(B1).如果我们决策选择了C3,则u2(B1)=C3. 全过程中各个阶段的决策组成的有序总体称为策略。上例中每一条路线都被称为一个策略。使整个问题达到最优效果的策略就是最优策略.即上例中，路最短的策略就是最优策略。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.