基于潜在状态推断时空关系强化学习在自动驾驶中应用.pdfVIP

  • 0
  • 0
  • 约7.06万字
  • 约 16页
  • 2026-05-19 发布于北京
  • 举报

基于潜在状态推断时空关系强化学习在自动驾驶中应用.pdf

基于潜在状态推断和时空关系的强化学自动驾驶中的

应用

1,21,3211

,李家成,迈克尔·J·科亨尔,大卫·伊塞勒,和藤村贵久

—深度强化学习(DRL)为在复杂的自动驾驶场景中

学习导航了一种有前景的方法。然而,识别能够指示截然

不同结果的细微线索仍然是设计在人类环境中运行的自主系统

的一个开放问题。在这项工作中,我们展示了在强化学习框架

中显式推断潜在状态并编码时空关系可以帮助解决这一难题。

我们通过结合强化学习器与监督学习器的框架来编码其他驾驶

图1:T型交叉路口场景:自车(蓝色)试图右转并汇入前方车

员潜在状态的先验知识。此外,我们通过图神经网络(

道,同时避免与保守型(绿色)和激进型(红色)车辆发生碰

GNNs)建模不同车辆之间的相互影响。与最先进的基线方法

撞。

相比,所框架在导航T形路口的性能上

文档评论(0)

1亿VIP精品文档

相关文档