- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动态规划问题PPT.ppt
第四章 动态规划问题 动态规划的概念与模型 静态决策 一次性决策 多段决策过程 具有无后效性的多段决策过程 K后部子过程 动态规划模型 动态规划的建模 动态规划的建模 动态规划的建模 动态规划的建模 动态规划解的概念 动态规划最优性原理 动态规划最优性原理 动态规划最优性原理 贝尔曼函数 贝尔曼函数 贝尔曼函数 动态规划基本方程 动态规划基本方程 动态规划基本方程 动态规划方法基本原理 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划四大要素、一个方程 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短短问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 a d b e t c f s 9 7 5 7 8 4 5 6 4 6 5 4 7 状态变量xk取为k阶段所在地,则有: a d b e t c f s 9 7 5 7 8 4 5 6 4 6 5 4 7 k阶段决策是决定下一步走到哪里,uk(xk)取为下一步的所在点。 逆序求条件最优目标函数集和条件最优决策集 由于第3阶段末已到达t,往后的距离自然是零,因此f4(t)=0 对3阶段所有可能的状态X3={d, e, f}计算f3( )如下 逆序求条件最优目标函数集和条件最优决策集 也可以用表格方法计算如下 t t t 5 7 4 5+0 7+0 4+0 d e f U3() F3() t/t r3(x3,u3)+f4(x4) f3(x3) u3(x3) 逆序求条件最优目标函数集和条件最优决策集 对2阶段所有可能的状态X2={a, b, c}计算f2( )如下 逆序求条件最优目标函数集和条件最优决策集 对2阶段所有可能的状态X2={a, b, c}计算f2( )如下 逆序求条件最优目标函数集和条件最优决策集 也可以用表格方法计算如下 7+5 5+5 4+5 d/d 6+7 5+7 e/e f d d 8 10 9 4+4 6+4 a b c U2() F2() f/f f2(x2) u2(x2) r2(x2,u2)+f3(x3) 逆序求条件最优目标函数集和条件最优决策集 对1阶段所有可能的状态X1={s}计算f1( )如下 9+8 a/a 8+10 b/b f 16 7+9 s U2() F2() c/c * * 动态决策 多阶段决策 决策 x1 x2 Z u 输入 决策 输出 决策效应 第一月 x1 x2 r1 u1 第二月 x3 r2 u2 第三月 x4 r3 u3 T1 x1 x2 r1 u1 T2 x3 r2 u2 Tk xk xk+! rk uk Tn xn xn+1 rn un … … n个决策子问题 K称为阶段变量 xk描述k阶段初的状态,称为状态变量 一般把输入状态称为该阶段的阶段状态。 uk的取值代表k阶段对第k子问题所进行的决策,称为k阶段的决策变量 rk为k阶段从状况xk出发,做决策uk之后的后果,称为k阶段的阶段效应。 Xk+1=Tk (xk, uk) 系统从k阶段往后的决策只与k阶段系统的状态xk有关,而与系统以前的决策无关,则称为具有无后效性的多段决策过程。 T1 x1 x2 r1 (x1, u1) u1(x1) T2 x3 r2 (x2 ,u2) u2 (x2) Tk xk xk+! rk (xk,uk) uk (xk) Tn xn xn+1 … … rn (xn,un) un (xn) 多段决策过程中从第k阶段到最终阶段的过程称为k-后部子过程,简称k-子过程。 Tk xk xk+! rk (xk,uk) uk (xk) Tn xn xn+1 … rn (xn,un) un (xn) Opt表示求优 Xk是一个集合,表示k阶段状态可能取值的范围,称为状态可能集合。 Uk是一个集合,表示k阶段决策可能取值的范围,称为决策允许集合,一般来说对于不同状态,可以作的决策的范围是不同的。因此决策允许集合一般写为Uk(xk)。 动态规划建模 ①确定阶段与阶段变量 ②明确状态变量和状态可能集合。 ③确定决策变量和决策允许集合。 ④确定状态转移方程。 ⑤明确阶段效应和目标。 ①确定阶段与阶段
您可能关注的文档
最近下载
- 2021-2022学年江西省南昌市九年级(上)期中物理试卷(附答案详解).docx VIP
- 全自动氩气纯化器-四川普瑞净化设备有限公司.PDF VIP
- 山东科学技术版劳动实践指导手册六年级第3课家用器具使用与维护家用电器的使用科学使用电冰箱 教案.docx VIP
- 单式氩气纯化器技术参数要求.DOC VIP
- 央国企成立数科公司底层逻辑与相关定位.docx VIP
- (正式版)C-J-T 232-2006 薄壁不锈钢内卡式管材及管件.docx VIP
- 2025年医学检验实验室ISO15189认可评审介绍.pptx VIP
- 八个方向路线图.ppt VIP
- 优秀大学生职业生涯规划书经典PPT.pptx VIP
- GB50007-2011 建筑地基基础设计规范.docx
文档评论(0)