运筹学动态规划.pptVIP

下载本文档

39
0
约2.51万字
约 191页
2017-03-28 发布于贵州
举报
版权申诉

运筹学动态规划.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

运筹学动态规划运筹学动态规划

动态规划引言 □过程指标函数Vkn通常是描述所实现的全过程或k后部子过程效果优劣的数量指标，它是由各阶段的阶段指标函数vk(xk,uk)累积形成的。（1）可分性：适于用动态规划求解的问题的过程指标函数（即目标函数），必须具有关于阶段指标的可分离形式，即对于后部子过程的指标函数可以表示为： Vkn( xk, uk, xk+1, uk+1, ··· , xn ) = vk(xk, uk) ? vk+1(xk+1, uk+1) ? ··· ? vn(xn, un) 式中，?表示某种运算，可以是加、减、乘、除、开方等。 □多阶段决策问题中，常见的目标函数形式之一是取各阶段效应之和的形式，即: □有些问题，如系统可靠性问题，其目标函数是取各阶段效应的连乘积形式，如：总之，具体问题的目标函数表达形式需要视具体问题而定。（2）可递推：过程指标函数Vkn要满足递推关系，即 □多阶段决策问题的数学模型综上所述，适于应用动态规划方法求解的一类多阶段决策问题的数学模型呈以下形式: f1 = opt V1n( x1 , p1n ) 最优指标函数 xk+1=Tk( xk, uk(xk) ) 状态转移方程 uk∈Dk 决策变量 xk∈Sk 状态变量 k=1,2,…,n 阶段变量多阶段决策过程的最优化一般有三种思路求解 1.全枚举法或穷举法：它的基本思想是列举出所有可能发生的方案和结果，再对它们一一进行比较，求出最优方案。可以计算：从A到E的路程可分为4个阶段。第一段走法有3 种，第二段走法有3种，第三段走法有2种，第四段走法仅1种，共有3×3×2×1＝18条可能的路线，分别算出各条路线的距离，最后进行比较，可知最优路线是A→B3→C2 →D2→E，最短距离是11。用穷举法求最优路线的计算工作量将会十分庞大，而且其中包含着许多重复计算。 2.局部最优路径法：某人从k点出发，并不顾及全线是否最短，只是选择当前最短途径，“逢近便走”，错误地以为局部最优会致整体最优，在这种想法指导下，所取决策必是 A→B1→C2→D2→E，全程长度是14；显然，这种方法的结果常是错误的。 □小结： ◎全枚举法虽可找出最优方案，但不是个好算法， ◎局部最优法则完全是个错误方法， ◎只有动态规划方法属较科学有效的算法 3. 贝尔曼最优化原理（动态规划方法） 4.函数基本方程基于这个原理，提出了一种逆序递推法；该法的关键在于给出一种递推关系。一般把这种递推关系称为动态规划的函数基本方程。对于求最小的加法的基本方程为（如例1）： □用函数基本方程逆推求解是常用的方法：首先要有效地建立动态规划模型，然后再递推求解，最后得出结论。 □正确地建立一个动态规划模型，是解决问题的关键。 □标号法的一般步骤：（1）给最后一段标号，该段各状态（即各始点）到终点的距离用数字分别标在各点上方的方格内，并用粗箭线连接各点和终点。（2）向前递推，给前一阶段的各个状态标号。每个状态上方方格内的数字表示该状态到终点的最短距离。将刚标号的点沿着最短距离用粗箭线连接起来，表示出各刚标号的点到终点的最短路线。