用于自动驾驶基于模型动作提议摊销学习.pdf

用于自动驾驶基于模型动作提议摊销学习.pdf

用于自动驾驶的基于模型的动作提议的摊销Q学习

布兰卡·米尔切夫斯卡¨

,玛丽亚·H格尔,加布里埃尔·卡尔,莫里茨·维尔林,·博德克尔

—已建立的优化方法可以保证在较短的优化时间范围

内(通常不超过几秒)的最佳轨迹。然而,选择这个短期范围

内的最佳轨迹仍可能导致次优的长期解决方案。同时,生成的

短期轨迹允许在动态交通环境中进行有效、舒适且可证明安

文档评论(0)

1亿VIP精品文档

相关文档