- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
组合最优化态规划
第三章 动态规划
*动态规划是解决多阶段决策过程的最优化问题的一种方法.所谓多阶段决策过程是指这样的一类决策过程,由于它的特殊性,我们可以把它按时间分为若干阶段(有时称为“时段”),而在每一个阶段都需要作出决策,以便使整个过程取得最佳的经济效益.在多阶段决策问题中,各个阶段采取的决策一般说来是与时间有关系的.而且,前一阶段采取的策略如何,不但与该阶段的经济效益有关系,更直接影响以后各阶段的经济效益.可见,它是一个动态的问题, 因此,处理的方法称为动态规划方法.
*动态规划也可以用来处理一些本来与时间没有关系的静态模型, 这只要在静态模型中人为地引进“时间”因素,分成时段,就可以把它看作多阶段的动态模型,用动态规划方法去处理.
§3.1 最短路问题与最优化原则
问题: 所谓最短路问题是指给定始点及终点,并知道由始点到终点的各种可能的路径, 问题是要找一条由始点到终点的最短的路,即长度最短的路.
例子:
下图(见黑板)是表示由始点A到终点E的路线图.由A至B(B1﹑B2或B3)是第一阶段; 由某Bi (i=1,2,3)至C(C1﹑C2或C3)是第二阶段; 由某Cj (j=1,2,3)至D(D1或D2)是第三阶段; 由某Dk (k = 1,2)至E是第四阶段.
引进几个符号和概念:
(1) n表示由某点(例如A, Bi (i = 1,2,3), Cj(j = 1,2,3), Dk (k = 1,2))到终点之间的阶段数. 例如: A到E的阶段数n = 4.
(2) S表示在任一阶段所处的位置,称S为状态变量(S可取A, Bi (i = 1,2,3), Cj (j = 1,2,3), Dk (k = 1,2), E).
(3) xn(S)称为决策变量, 它表示当处于状态S还有n个阶段要走时, 下一步所选取的点(例如: 当x3(B1)=C1时, 它表示现在处于点B1, 还有三个阶段要走, 下一步选取点C1, 即要走
B1→C1的路线).
(4) fn(S)表示现在处于状态S, 还有n个阶段要走, 由S至终点E的最短距离(例如: f4(A)表示现在处于点A, 还有四个阶段要走, 由A到终点E的最短距离.
(5) d(S, xn(S))表示点S到下一步所选的点xn(S)的距离(例如:
d(A, B1)表示由A到B1的距离, 即d(A, B1)=3).
分析:
由A到B的第一阶段有三种走法:
AB1, 若选此走法, 最短距离为
d(A, B1)+f3(B1)
AB2, 若选此走法, 最短距离为
d(A, B2)+f3(B2)
AB3, 若选此走法, 最短距离为
d(A, B3)+f3(B3)
f4(A)应当在上面三种走法中选取距离最小者.也即
f4(A)=min = min
要求f4(A), 必须先算出f3(B1), f3(B2)及f3(B3).
现在算f3(B1). 有两种走法:
B1C1, 若选此走法, 最短距离为
d(B1, C1)+f2(C1)
B1C2, 若选此走法, 最短距离为
d(B1, C2)+f2(C2)
f3(B1)应当在上两种走法中选取距离最小者.
f3(B1)=min=min
同理, f3(B2)和f3(B3)的算法如下.
f3(B2)=min=min
f3(B3)=min=min
f2(C1) =min=min
f2(C2) =min=min
f2(C3) =min=min
由于D1(或D2)经过一个阶段到终点E只有一种走法, 因此
f1(D1) = d(D1,E) = 1
f1(D2) = d(D2,E) = 2.
从后往前倒推.
n=1时,
f1(D1) = 1, 路径: D1→E
f1(D2) = 2, 路径: D2→E
n=2时,
f2(C1) = 4, 路径: C1→D2→E
f2(C2) = 7, 路径: C2→D1→E
f2(C3) = 7, 路径: C3→D2→E
n = 3时,
f3(B1) = 5, 路径: B1→C1→D2→E
f3(B2) = 11, 路径: B2→C2→D1→E
f3(B3) = 8, 路径: B3→C1→D2→E
n=4时,
f4(A) = 8, 路径: A→B1→C1→D2→E
在例1中我们主要利用了n个阶段与n―1个阶段的关系式(称为递推关系式或函数方程):
fn(S)=min{ d(S, xn(S)) + fn-1(xn(S)) }
而n=1时, 有
f1(S) = d(S, E)
上述递推关系式可以用“最优化原则”来描述:
一个过程的最优策略具有这样的性质,即无论其初始状态和初始决策如何, 其今后诸决策对以第一个决策所形成的状态作为初始状态的过程而言, 必须构成
文档评论(0)