- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 动态规划问题 动态规划的概念与模型 静态决策 一次性决策 多段决策过程 具有无后效性的多段决策过程 K后部子过程 动态规划模型 动态规划的建模 动态规划的建模 动态规划的建模 动态规划的建模 动态规划解的概念 动态规划最优性原理 动态规划最优性原理 动态规划最优性原理 贝尔曼函数 贝尔曼函数 贝尔曼函数 动态规划基本方程 动态规划基本方程 动态规划基本方程 动态规划方法基本原理 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划问题求解的一般步骤 动态规划四大要素、一个方程 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 动态规划应用举例----最短短问题 动态规划应用举例----最短路问题 动态规划应用举例----最短路问题 a d b e t c f s 9 7 5 7 8 4 5 6 4 6 5 4 7 状态变量xk取为k阶段所在地,则有: a d b e t c f s 9 7 5 7 8 4 5 6 4 6 5 4 7 k阶段决策是决定下一步走到哪里,uk(xk)取为下一步的所在点。 逆序求条件最优目标函数集和条件最优决策集 由于第3阶段末已到达t,往后的距离自然是零,因此f4(t)=0 对3阶段所有可能的状态X3={d, e, f}计算f3( )如下 逆序求条件最优目标函数集和条件最优决策集 也可以用表格方法计算如下 t t t 5 7 4 5+0 7+0 4+0 d e f U3() F3() t/t r3(x3,u3)+f4(x4) f3(x3) u3(x3) 逆序求条件最优目标函数集和条件最优决策集 对2阶段所有可能的状态X2={a, b, c}计算f2( )如下 逆序求条件最优目标函数集和条件最优决策集 对2阶段所有可能的状态X2={a, b, c}计算f2( )如下 逆序求条件最优目标函数集和条件最优决策集 也可以用表格方法计算如下 7+5 5+5 4+5 d/d 6+7 5+7 e/e f d d 8 10 9 4+4 6+4 a b c U2() F2() f/f f2(x2) u2(x2) r2(x2,u2)+f3(x3) 逆序求条件最优目标函数集和条件最优决策集 对1阶段所有可能的状态X1={s}计算f1( )如下 9+8 a/a 8+10 b/b f 16 7+9 s U2() F2() c/c * * 动态决策 多阶段决策 决策 x1 x2 Z u 输入 决策 输出 决策效应 第一月 x1 x2 r1 u1 第二月 x3 r2 u2 第三月 x4 r3 u3 T1 x1 x2 r1 u1 T2 x3 r2 u2 Tk xk xk+! rk uk Tn xn xn+1 rn un … … n个决策子问题 K称为阶段变量 xk描述k阶段初的状态,称为状态变量 一般把输入状态称为该阶段的阶段状态。 uk的取值代表k阶段对第k子问题所进行的决策,称为k阶段的决策变量 rk为k阶段从状况xk出发,做决策uk之后的后果,称为k阶段的阶段效应。 Xk+1=Tk (xk, uk) 系统从k阶段往后的决策只与k阶段系统的状态xk有关,而与系统以前的决策无关,则称为具有无后效性的多段决策过程。 T1 x1 x2 r1 (x1, u1) u1(x1) T2 x3 r2 (x2 ,u2) u2 (x2) Tk xk xk+! rk (xk,uk) uk (xk) Tn xn xn+1 … … rn (xn,un) un (xn) 多段决策过程中从第k阶段到最终阶段的过程称为k-后部子过程,简称k-子过程。 Tk xk xk+! rk (xk,uk) uk (xk) Tn xn xn+1 … rn (xn,un) un (xn) Opt表示求优 Xk是一个集合,表示k阶段状态可能取值的范围,称为状态可能集合。 Uk是一个集合,表示k阶段决策可能取值的范围,称为决策允许集合,一般来说对于不同状态,可以作的决策的范围是不同的。因此决策允许集合一般写为Uk(xk)。 动态规划建模 ①确定阶段与阶段变量 ②明确状态变量和状态可能集合。 ③确定决策变量和决策允许集合。 ④确定状态转移方程。 ⑤明确阶段效应和目标。 ①确定阶段与阶段
您可能关注的文档
最近下载
- 《小学四年级期末家长会》课件模板(五套).pptx
- SY∕T 4204-2019 石油天然气建设工程施工质量验收规范 油气田集输管道工程.pdf
- 国开开放系统22422《汽车发动机构造与维修》期末机考真题及答案(第101套).pdf
- 河南中宜创芯发展有限公司年产1000吨电子级高纯碳化硅粉体项目(一期)环境影响报告书.pdf
- 缓速器电控系统培训0413.ppt VIP
- 2024年“七一”专题党课讲稿:做一名合格共产党员.docx VIP
- 大厦加装电梯项目工程钢结构吊装专项施工方案.doc VIP
- 降低老年患者功能性便秘发生率.pptx
- 红星照耀中国阅读计划.docx
- 2024年党纪学习教育ppt(党课).pptx VIP
文档评论(0)