动态规划问题.pptVIP

下载本文档

2
0
约4.03千字
约 41页
2022-05-24 发布于重庆
举报

动态规划问题.ppt

第四章动态规划问题第一页，共四十一页。动态规划的概念与模型静态决策一次性决策动态决策多阶段决策决策 x1 x2 Z u 输入决策输出决策效应第一月 x1 x2 r1 u1 第二月 x3 r2 u2 第三月 x4 r3 u3 第二页，共四十一页。多段决策过程 T1 x1 x2 r1 u1 T2 x3 r2 u2 Tk xk xk+! rk uk Tn xn xn+1 rn un … … n个决策子问题 K称为阶段变量 xk描述k阶段初的状态，称为状态变量一般把输入状态称为该阶段的阶段状态。 uk的取值代表k阶段对第k子问题所进行的决策，称为k阶段的决策变量 rk为k阶段从状况xk出发,做决策uk之后的后果，称为k阶段的阶段效应。第三页，共四十一页。具有无后效性的多段决策过程 Xk+1=Tk (xk, uk) 系统从k阶段往后的决策只与k阶段系统的状态xk有关,而与系统以前的决策无关，则称为具有无后效性的多段决策过程。 T1 x1 x2 r1 (x1, u1) u1(x1) T2 x3 r2 (x2 ,u2) u2 (x2) Tk xk xk+! rk (xk,uk) uk (xk) Tn xn xn+1 … … rn (xn,un) un (xn) 第四页，共四十一页。 K后部子过程多段决策过程中从第k阶段到最终阶段的过程称为k-后部子过程，简称k-子过程。 Tk xk xk+! rk (xk,uk) uk (xk) Tn xn xn+1 … rn (xn,un) un (xn) 第五页，共四十一页。动态规划模型 Opt表示求优 Xk是一个集合，表示k阶段状态可能取值的范围，称为状态可能集合。 Uk是一个集合，表示k阶段决策可能取值的范围，称为决策允许集合，一般来说对于不同状态，可以作的决策的范围是不同的。因此决策允许集合一般写为Uk(xk)。第六页，共四十一页。动态规划的建模动态规划建模 ①确定阶段与阶段变量 ②明确状态变量和状态可能集合。 ③确定决策变量和决策允许集合。 ④确定状态转移方程。 ⑤明确阶段效应和目标。第七页，共四十一页。动态规划的建模 ①确定阶段与阶段变量阶段的划分一般是按照决策进行的时间或空间上的先后顺序划分的，阶段数等于多段决策过程中从开始到结束所需要作出决策的数目，阶段变量用k表示。 ②明确状态变量和状态可能集合。状态变量必须包含在给定的阶段上确定全部允许决策所需要的信息。状态变量的确定决定了整个决策过程是不是具有无后效性，因而也决定着能不能用动态规划方法来求解。状态可能集是关于状态的约束条件，因此为了求解必须正确地确定状态可能集。第八页，共四十一页。动态规划的建模 ③确定决策变量和决策允许集合。与静态问题相同，决策变量应能够反映对问题所作的决策，决策变量也应有其相应的约束条件，在建模时应明确决策允许集合Uk(xk)。 ④确定状态转移方程。系统k阶段从状态xk出发作了决策uk(xk)之后的结果之一是系统状态的转移，这一结果直接影响系统往后的决策过程，因此必须明确状态的转移过程，即根据问题的内在关系，明确xk+1=Tk(xk,uk)中的函数Tk（）。第九页，共四十一页。动态规划的建模 ⑤明确阶段效应和目标。阶段效应rk(xk,uk)是在阶段k以xk出发作了决策uk之后所产生的后果，必须明确rk与xk，uk的关系，才能构成目标函数。目标函数是由阶段效应经过某种集结而得到的，如何集结视具体问题而定，同时还应根据问题确定目标是求最大还是最小。由于在经济系统中的大多数情况下，目标的集结方法都是求和，因此，在不作说明的情况下，往后的讨论都针对目标为和的形式进行。第十页，共四十一页。动态规划解的概念多段决策过程中所要求解的是，从起始状态x1开始，进行一系列的决策，使目标R达到最优最优目标值 R* 最优策略使得目标达到最优的决策序列。最优路线在采取最优策略时，系统从x1开始所经过的状态序列求解动态规划模型找到最优策略、最优路线和最优目标值。第十一页，共四十一页。动态规划最优性原理多段决策过程的特点每个阶段都要进行决策相继进行的阶段决策构成的决策序列前一阶段的终止状态又是后一阶段的初始状态阶段最优决策不能只从本阶段的效应出发，必须通盘考虑，整体规划。阶段k的最优决策不应该只是本阶段效应的最优，而必须是本阶段及其所有后续阶段的总体最优，即关于整个k后部子过程的最优决策。第十二页，共四十一页。动态规划最优性原理最优性原理

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

动态规划问题.pptVIP