- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运筹学动态规划运筹学动态规划
动态规划 引 言 □过程指标函数Vkn通常是描述所实现的全过程或k后部子过程效 果优劣的数量指标,它是由各阶段的阶段指标函数vk(xk,uk)累积形 成的。 (1)可分性:适于用动态规划求解的问题的过程指标函数(即目 标函数),必须具有关于阶段指标的可分离形式,即对于后部子 过程的指标函数可以表示为: Vkn( xk, uk, xk+1, uk+1, ··· , xn ) = vk(xk, uk) ? vk+1(xk+1, uk+1) ? ··· ? vn(xn, un) 式中,?表示某种运算,可以是加、减、乘、除、开方等。 □多阶段决策问题中,常见的目标函数形式之一是取各阶段效应 之和的形式,即: □有些问题,如系统可靠性问题,其目标函数是取各阶段效应的 连乘积形式,如: 总之,具体问题的目标函数表达形式需要视具体问题而定。 (2)可递推:过程指标函数Vkn要满足递推关系,即 □多阶段决策问题的数学模型 综上所述,适于应用动态规划方 法求解的一类多阶段决策问题的数学模型呈以下形式: f1 = opt V1n( x1 , p1n ) 最优指标函数 xk+1=Tk( xk, uk(xk) ) 状态转移方程 uk∈Dk 决策变量 xk∈Sk 状态变量 k=1,2,…,n 阶段变量 多阶段决策过程的最优化一般有三种思路求解 1.全枚举法或穷举法:它的基本思想是列举出所有可能发生的 方案和结果,再对它们一一进行比较,求出最优方案。 可以计算:从A到E的路程可分为4个阶段。第一段走法有3 种,第二段走法有3种,第三段走法有2种,第四段走法仅1种, 共有3×3×2×1=18条可能的路线,分别算出各条路线的距离, 最后进行比较,可知最优路线是A→B3→C2 →D2→E,最短距离 是11。 用穷举法求最优路线的计算 工作量将会十分庞大,而且 其中包含着许多重复计算。 2.局部最优路径法:某人从k点出发,并不顾及全线是否最短, 只是选择当前最短途径,“逢近便走”,错误地以为局部最优会 致整体最优,在这种想法指导下,所取决策必是 A→B1→C2→D2→E,全程长度是14;显然,这种方法的结果常 是错误的。 □小结: ◎全枚举法虽可找出最优方案,但不是个好算法, ◎局部最优法则完全是个错误方法, ◎只有动态规划方法属较科学有效的算法 3. 贝尔曼最优化原理(动态规划方法) 4.函数基本方程 基于这个原理,提出了一种逆序递推法;该法的关键在于给 出一种递推关系。一般把这种递推关系称为动态规划的函数基本 方程。 对于求最小的加法的基本方程为(如例1): □用函数基本方程逆推求解是常用的方法: 首先要有效地建立动态规划模型, 然后再递推求解, 最后得出结论。 □正确地建立一个动态规划模型,是解决问题的关键。 □标号法的一般步骤: (1)给最后一段标号,该段各状态(即各始点)到终点的距 离用数字分别标在各点上方的方格内,并用粗箭线连接各点和终 点。 (2)向前递推,给前一阶段的各个状态标号。每个状态上方 方格内的数字表示该状态到终点的最短距离。将刚标号的点沿着 最短距离用粗箭线连接起来,表示出各刚标号的点到终点的最短 路线。
文档评论(0)