- 9
- 0
- 约1.11千字
- 约 14页
- 2016-11-22 发布于湖北
- 举报
动态规划类算法 DDDP 离散微分动态规划法(Discrete differential dynamic programming – DDDP) 选定初始可行的决策序列和相应的状态序列; 选增量形成廊道:取定增量Δ,在初始状态序列的上下各变动Δ,形成一个带状的“廊道”,每个阶段一个状态变量只可能取三个值, ; 3. 在廊道内用动态规划法选优得到较好的新的状态序列; 4. 反复迭代:以新的状态序列代替初始状态序列,重复1.2.3.,直到收敛为止,得最优状态序列和最优决策序列。 例. 设 用动态规划法求最优解。 DDDP法的特点 能有效减轻动态规划的“维数灾”: 与动态规划发比较,大大减少存储量;计算量一般也会减少较多,但与初始状态序列的选取有关。 不能保证得到全局最优解,可能收敛到局部最优解; DDP 微分动态规划法Differential Dynamic Programming (DDP) 对DP的递推方程 设初始状态为 ,相应的决策为 ,记 将f,r在 , 处展开成二次Taylor多项式, T线性展开: 则 令其对 的梯度为0,得: 代入目标函数得 其中,矩阵Ak,bk可由上述系数矩阵表示。 顺推根据状态的增量求决策增量,在由状态转移方程的下一阶段的状态增量,从而得新的状态序列和决策序列。 特点:
您可能关注的文档
- 动漫人物眼睛课件美术.ppt
- 动漫书屋创业方案设计书1.doc
- 动漫衍生产品调研报告.pptx
- 动漫衍生品设计.ppt
- 动名词、分词用法.ppt
- 动能定理(第二课时).ppt
- 动能定理的应用总结.doc
- 动能定理机械能守恒定律知识点例题(精).doc
- 动能定理及机械能守恒定律(学生).doc
- 动能定理题目.doc
- 甘肃省武威市2023-2024学年高三上学期1月期末政治试题含答案(OCR).pdf
- 河北省沧衡名校联盟2023-2024学年高三上学期期末联考历史试题(OCR).pdf
- 河北省沧衡名校联盟2023-2024学年高三上学期期末联考语文试题(OCR).pdf
- 河南省TOP二十名校2024届高三上学期调研考试九数学试卷及答案(OCR).pdf
- 河北省2023-2024学年高三上学期1月期末质量检测物理试题含答案(OCR).pdf
- 河北省邯郸市磁县第一中学2023-2024学年高三上学期八调考试 物理试卷含答案(OCR).pdf
- 广东省2023-2024学年金太阳高三上学期期末联考政治试题含答案(OCR).pdf
- 河北省保定市2023-2024学年高三上学期1月期末考试政治试题含答案(OCR).pdf
- 河北省2023-2024学年高三上学期1月期末质量检测化学试题含答案(OCR).pdf
- 黑龙江省哈三中高三上(12月)-化学试题及答案(OCR).pdf
原创力文档

文档评论(0)