通过测度松弛实现随机最优控制.pdfVIP

  • 0
  • 0
  • 约1.15万字
  • 约 8页
  • 2026-03-06 发布于北京
  • 举报

通过测度松弛实现随机最优控制

11

EtienneBuehrleandChristophStiller

1KarlsruheInstituteofTechnology

{etienne.buehrle,stiller}@

中摘要

1随机系统最优控制问题通常通过鲁棒优化或基于场景的优化方法解决,

v

6这两种方法都难以扩展到较长的优化时域。我们将随机系统的最优控制问

8

8题表述为占用测度上的凸优化问题,扩展了[10]。我们在一组合成和实际世

0界场景中演示了我们的方法,通过Christoffel多项式从数据中学习成本函

0

.数。我们实验的代码可以在/ebuehrle/dpoc获得。

8

0

5

21介绍

:

v

i

x随机系统的最优控制问题通常通过鲁棒的[2,20]或基于场景的[7,18,

r

a16]优化方法来解决,这两种方法都因为其开环特性而难以扩展到较长的优

化时域。

动态规划公式[4]虽然适用于随机系统,但通常涉及非凸优化问题,并

且不支持指定终端分布。

多项式优化已被提出用于确定性非线性[10]系统和混合系统[15]。我们

将该方法扩展到使用福克-普朗克方程的弱形式的随机系统。作为代价函数,

我们建议使用可以从数据中估计出的克里斯托费尔多项式。

1

2背景

我们回顾弱最优控制及其与具有动力学系统的最优传

输的联系。

2.1最优传输

将一个测度优化运输到另一个测度可以被表述为一个有限视界

的最优化控制问题,其受限于一个连续性方程

和边界约束,[3]。

2.2弱最优控制

弱最优控制定义了一个在时间区间上的支持测度,该测度

受传输方程和的约束,从而产生一个

可以在测度空间中被规范转换为半定规划问题[11,19]的线性规划问题。

2.3对偶多项式程序

对偶是一个多项式规划

max(1)

s.t.(2)

,其中包含,可以被规范地转化为一个半定规划[5,1

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档