- 0
- 0
- 约1.15万字
- 约 8页
- 2026-03-06 发布于北京
- 举报
通过测度松弛实现随机最优控制
11
EtienneBuehrleandChristophStiller
1KarlsruheInstituteofTechnology
{etienne.buehrle,stiller}@
本
译
中摘要
1随机系统最优控制问题通常通过鲁棒优化或基于场景的优化方法解决,
v
6这两种方法都难以扩展到较长的优化时域。我们将随机系统的最优控制问
8
8题表述为占用测度上的凸优化问题,扩展了[10]。我们在一组合成和实际世
0界场景中演示了我们的方法,通过Christoffel多项式从数据中学习成本函
0
.数。我们实验的代码可以在/ebuehrle/dpoc获得。
8
0
5
21介绍
:
v
i
x随机系统的最优控制问题通常通过鲁棒的[2,20]或基于场景的[7,18,
r
a16]优化方法来解决,这两种方法都因为其开环特性而难以扩展到较长的优
化时域。
动态规划公式[4]虽然适用于随机系统,但通常涉及非凸优化问题,并
且不支持指定终端分布。
多项式优化已被提出用于确定性非线性[10]系统和混合系统[15]。我们
将该方法扩展到使用福克-普朗克方程的弱形式的随机系统。作为代价函数,
我们建议使用可以从数据中估计出的克里斯托费尔多项式。
1
2背景
我们回顾弱最优控制及其与具有动力学系统的最优传
输的联系。
2.1最优传输
将一个测度优化运输到另一个测度可以被表述为一个有限视界
的最优化控制问题,其受限于一个连续性方程
和边界约束,[3]。
2.2弱最优控制
弱最优控制定义了一个在时间区间上的支持测度,该测度
受传输方程和的约束,从而产生一个
可以在测度空间中被规范转换为半定规划问题[11,19]的线性规划问题。
2.3对偶多项式程序
对偶是一个多项式规划
max(1)
s.t.(2)
,其中包含,可以被规范地转化为一个半定规划[5,1
您可能关注的文档
- GMAT: 基于多智能体的临床描述生成以供文本编码器在视觉语言 MIL 中用于全幻灯片图像分类.pdf
- 关于宽带 ODDM 系统中多普勒斜视的特征与评估.pdf
- ModelNet40-E:一个面向点云分类的不确定性感知基准测试.pdf
- 通过对抗引导课程采样增强基于扩散的数据集蒸馏.pdf
- SketchAgent:从手绘草图生成结构化图表.pdf
- 具有风险保证的故障检测中的校准预测集通过显著性检验.pdf
- 展示了联网和自动驾驶车辆在网络安全、安全性和隐私问题方面的标准和方法.pdf
- WIP:通过 AI 驱动的同伴代理增强基于游戏的学习.pdf
- 基于图的交互增强网络用于稳健的多模态情感分析.pdf
- RoboLinker: 一种基于扩散模型的人类与陪伴机器人之间的匹配服装生成器.pdf
最近下载
- 克劳锐:2022年社交媒体美妆内容发展洞察.pdf VIP
- 人大社《社会工作综合能力(初级)》第四章 社会工作服务专业价值观与道德规范 社会工作综合能力(初级).pptx VIP
- 激活个体与团队-利用PK机制推动业务变革.pptx VIP
- 人大社《社会工作综合能力(初级)》第十二章 社会工作服务相关法规与政策 社会工作综合能力(初级).pptx VIP
- 从物、符号构成的世界全域看文艺——赵毅衡教授的“艺术符号论”述评.pdf VIP
- 新世纪大学英语综合教程 (第3版)第1册 PPT课件U1.pptx
- 高效能管理系列工作之PK机制导入.pdf VIP
- 病历丢失应急预案流程.docx VIP
- 毕业设计(论文)-中型货车驱动桥主减速器设计.doc VIP
- 人大社《社会工作综合能力(初级)》第六章 个案社会工作服务方法 社会工作综合能力(初级).pptx VIP
原创力文档

文档评论(0)