运筹学概论_第6章_动态规划教材教学课件.pptVIP

下载本文档

12
0
约6.46千字
约 63页
2018-03-14 发布于天津
举报
版权申诉

运筹学概论_第6章_动态规划教材教学课件.ppt

1、本文档共63页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

教学课件讲义PPT教学教案培训资料医学中小学上课资料

所以最优路线为：即从A到F的最短距离为17。本段决策为再按计算顺序反推可得最优决策序列即这种递推关系称为动态规划的基本方程，(7.3b))式称为边界条件。从例2的计算过程中可以看出，在求解的各阶段，都利用了第k段和第k+1段的如下关系：将多阶段决策过程划分阶段，恰当地选取状态变量、决策变量及定义最优指标函数，从而把问题化成一族同类型的子问题，然后逐个求解。 (2) 求解时从边界条件开始，逆(或顺)过程行进方向，逐段递推寻优。在每一个子问题求解时，都要使用它前面已求出的子问题的最优结果，最后一个子问题的最优解,就是整个问题的最优解。 (3)动态规划方法是既把当前一段与未来各段分开，又把当前效益和未来效益结合起来考虑的一种最优化方法，因此每段的最优决策选取是从全局考虑的，与该段的最优选择一般是不同的。现将动态规划方法的基本思想总结如下动态规划的基本方程是递推逐段求解的根据，一般的动态规划基本方程可以表为：式中opt可根据题意取min或max，为状态sk、决策uk 时对应的第k阶段的指标函数值。从上图可以看出，无论从哪一段的某状态出发到终点F的最短路线，只与此状态有关，而与这点以前的状态、路线无关，即不受从A点是如何到达这点的决策影响。而且从A点到F点的最短路线若经过sk点，则此路线由sk点到F点的后半部，应是由sk点到F的最短路线。 Bellman最优化原理：一个过程的最优策略具有这样的性质：即无论初始状态基初始决策如何，对于先前决策所形成的状态而言，其以后的所有决策应构成最优策略。第5章动态规划多阶段决策过程的最优化动态规划的基本概念和基本原理动态规划模型的建立与求解第三节动态规划模型的建立与求解一、动态规划模型的建立建立动态规划的模型，就是分析问题并建立问题的动态规划基本方程。应用动态规划方法的关键在于:识别问题的多阶段特征，将问题分解成为可用递推关系式联系起来的若干子问题，而正确建立基本递推关系方程的关键又在于正确选择状态变量，保证各阶段的状态变量具有递推的状态转移关系。下面以资源分配问题为例介绍动态规划的建模条件及解法。资源分配问题是动态规划的典型应用之一，资源可以是资金、原材料、设备、劳力等，资源分配就是将一定数量的一种或几种资源恰当地分配给若干使用者，以获取最大效益。问如何分配投资数额才能使总效益最大? 例7 某公司有资金10万元，若投资于项目i(i=1,2,3)的投资额为xi时，其效益分别为解：可列出静态规划问题的模型如下 1. 分阶段：分三个阶段，即 k=1，2，3。将投资项目排序，首先考虑对项目1投资，然后考虑对项目2投资，最后考虑对项目3投资,即把问题划分为3个阶段，每个阶段只决定对一个项目应投资的金额。这样问题转化为一个3段决策过程。 2. 确定决策变量：通常可以取静态规划中的变量为决策变量。即设决策变量：决定给第k个项目投资的资金数。 3. 确定状态变量：状态变量与决策变量有密切关系，状态变量一般为累计量或随递推过程变化的量。可以把每阶段可供使用的资金定为状态变量，初始状态。为分配于第一种项目的资金数，则当第一阶段(k＝1)时，有状态转移方程: 状态变量：第k段可以投资于第k项到第3个项目的资金数。指标函数：最优指标函数： fk(sk) 当可投资金数为时，投资第k至第3项所得的最大收益数。基本方程：阶段k： k=1,2,3 状态变量sk:第k阶段可以投资于第k项到第3个项目的资金。决策变量xk:决定给第k个项目的资金。状态转移方程:sk+1=sk-xk 最优指标函数fk(sk):当可投资金为sk,投资第k项到第3个项目所得的最大收益。基本方程：建立动态规划模型的要点为： 1．分析题意，识别问题的多阶段特性，按时间或空间的先后顺序适当地划分为满足递推关系的若干阶段，对非时序的静态问题要人为地赋予“时段”概念。 2．正确地选择状态变量，使其具备两个必要特征： (1)可知性：即过程演变的各阶段状态变量的取值，能直接或间接地确定； (2)能够确切地描述过程的演变且满足无后效性。即由第k阶段的状态出发的后部子过程，可以看作是一个以为初始状态的独立过程。第6章动态规划多阶段决策过程的最优化动态规划的基本概念和基本原理动态规划模型的建立第一节