- 3
- 0
- 约6.87千字
- 约 49页
- 2017-02-08 发布于湖北
- 举报
教案_动态规划1_1要点
第四节: 动态规划的理论基础和 具体迭代方 法 多阶段决策过程的特点:每个阶段都要进行决策,策略是由n个相继进行的决策构成的决策序列。前一阶段的终止状态又是下一阶段的初始状态,因此,确定阶段最优决策不能只从阶段的效应来考虑,必须是整个过程通盘考虑,整体规划。即阶段k的最优决策不应该只是本阶段效应的最优,而必须是本阶段及其所有后续阶段的总体最优。 动态规划方法的理论基础是基于R. Bellman提出的最优性原理:“一个过程的最优策略具有这样的性质:即无论其初始状态及初始决策如何,对于先前决策所形成的状态而言,余下的诸决策仍构成最优策略。” A M B 1 . 理论基础 适应于用动态规划方法求解的是具有无后效性的多阶段决策过程。 最优性原理的含义是:最优策略的任何一部分子策略,也是它相应初始状态的最优策略。每个最优策略只能由最优子策略构成。 动态规划的最优性定理:设阶段数为n的多阶段决策过程,其阶段编号为k=0,1,...,n-1。允许策略 是最优策略的充要条件是对任意一个k, 0kn-1和s0?S0,有 它是由给定的初始状态s0和子策略p0,k-1所确定的k段状态。当V是效益函数时,opt取max;当V是损失函数时,opt
您可能关注的文档
最近下载
- 农业机械设计手册(上册)1-12.pdf VIP
- 2025年江苏省苏州市中考语文真题卷(含答案与解析).pdf VIP
- 基于单片机的老人防跌倒报警系统设计与实现.docx VIP
- T_HNJK 012—2025(艾条(柱)保健用品生产技术规范).pdf VIP
- 2025年上海市初中学业考试英语中考试卷真题(含答案详解).pdf VIP
- 中职化工课件PPT.pptx VIP
- 股市主力操盘盘 口摩斯密码(原创内容,侵权必究).pptx
- GB50856-2013 通用安装工程工程量计算规范.docx
- 2025高考数学(天津卷)第20题 导数解答题 教师比赛说课课件.pptx
- 从中小学教师到教师教育者的关键转变-来源:现代教育管理(第2019001期)-辽宁教育研究院.pdf VIP
原创力文档

文档评论(0)