- 11
- 0
- 约1.37千字
- 约 12页
- 2019-03-13 发布于江苏
- 举报
* 第五节:动态规划与静态规划之间的关系及其它相关总结 动态规划解法 逆序法 顺序法 静态规划 动态规划 线性规划 非线性规划 5.1 逆序(递推)法 设已知初始状态s1,最优值函数fk(sk)表示从k阶段到n阶段所得到的最大效益。以求最大化为例来说明。 具体方法如下: 当阶段k=n时 即 其中s表示状态,x表示决策(控制) 可得最优决策xn=xn(sn)和最优值fn(sn)。要注意的是,若D(sn)只有一个决策,则可写成 xn=xn(sn)。 当阶段k=n-1时 其中状态转移方程 得到最优决策xn-1=xn-1(sn-1)和最优值fn-1(sn-1)。 当阶段k=k时 其中状态转移方程 得最优决策xk=xk(sk)和最优值fk(sk)。 如此类推,直到第一阶段。 当阶段k=1时 其中状态转移方程 得最优决策x1=x1(s1)和最优值f1(s1)。 由于初始状态s1已知,故x1=x1(s1)和f1(s1)是确定的,根据状态转移方程按照上述递推过程相反顺序推算下去,就可逐步确定出每阶段的决策及效益。 例1 用动态规划的逆序法求解下面问题 解: 分阶段:(按照问题的变量个数划分阶段)分三个阶段,即k=1,2,3。 确定决策变量:通常可以取问题中的变量为决策变量。 确定状态变量:状态变量与决策变量有密切关系,状态变量一般为累计量 或随递推过程变化的量。 指标函数 最优指标函数 fk(sk)=maxVk,3 状态转移方程 决策变量 边界条件 f4(s4)=1 基本方程 当阶段k=3时,有 当阶段k=2时,有 得最优决策 最优目标函数 有两个解,其中x2=0舍去。 因2阶导数在x*2处小于0,故有极大值。 当阶段k=1时,有 得最优决策 最优目标函数 因此最后可得: 与前面一样 用微分法。 s3=s2-x*2=s1- x*1- x*2 例2 某公司有资金10万元,若投资于项目i(i=1,2,3)的投资额为xi时,其效益分别为 ,问如何分配投资数额才能使总效益最大。 解:可列出静态规划问题的模型如下 分阶段:(考虑效益函数的形式)分三个阶段,即k=1,2,3。 确定决策变量:通常可以取静态规划中的变量为决策变量。 确定状态变量:状态变量与决策变量有密切关系,状态变量一般为累计量或随递推过程变化的量。 此问题中可设: 状态转移方程 决策 指标函数 最优指标函数fk(sk)=max Vk,3 基本方程 当阶段k=3时,有 最优决策为 最优目标函数 每一阶段可使用的资金数为状态变量sk * * *
您可能关注的文档
最近下载
- 专题2 数据采集与编码 学案(含解析)2025届高中信息技术.DOCX VIP
- 高中地理课件湘教版:1-1中国的人口和民族.ppt
- 鲁科版高中化学选择性必修1第3章物质在水溶液中的行为3.3.2沉淀溶解平衡的应用课件(内嵌音频+视频).ppt VIP
- 建筑施工安全管理论文【推荐】.doc VIP
- 2025年高考地理识图填图完全手册(扫描版).docx
- 防火封堵材料 GB23864-2023.pdf
- 专题2 数据采集与编码 课件 2025届高中信息技术.pptx VIP
- 专题1 数据与大数据 课件 2025届高中信息技术.pptx VIP
- 鲁科版高中化学选择性必修1第3章物质在水溶液中的行为3.3.1沉淀溶解平衡与溶度积(内嵌音频+视频).ppt VIP
- 2025年甘肃省高考物理试卷(含答案解析).docx VIP
原创力文档

文档评论(0)