美团技术解析自动驾驶中的决策规划算法概述【最新版】.pdfVIP

下载本文档

6
0
约1.42万字
约 29页
2023-07-30 发布于山东
举报
版权申诉

美团技术解析自动驾驶中的决策规划算法概述【最新版】.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

美团技术解析自动驾驶中的决策规划算法概述 1. 引言在一套完整的自动驾驶系统中，如果将感知模块比作人的眼睛和耳朵，那么决策规划就是自动驾驶的大脑。大脑在接收到传感器的各种感知信息之后，对当前环境作出分析，然后对底层控制模块下达指令，这一过程就是决策规划模块的主要任务。同时，决策规划模块可以处理多么复杂的场景，也是衡量和评价自动驾驶能力最核心的指标之一[1]。图1. 自动驾驶系统中的决策规划模块分层结构，引用自[2] 如图1 所示，典型的决策规划模块可以分为三个层次。其中，全局路径规划（Route Planning）在接收到一个给定的行驶目的地之后，结合地图信息，生成一条全局的路径，作为为后续具体路径规划的参考；行为决策层（Behavioral Layer）在接收到全局路径后，结合从感知模块得到的环境信息（包括其他车辆与行人，障碍物，以及道路上的交通规则信息），作出具体的行为决策（例如选择变道超车还是跟随）；最后，运动规划（Motion Planning）层根据具体的行为决策，规划生成一条满足特定约束条件（例如车辆本身的动力学约束、避免碰撞、乘客舒适性等）的轨迹，该轨迹作为控制模块的输入决定车辆最终行驶路径。本文将分别介绍各层的主要作用与常见算法，并且比较各种算法的优劣性及适用情景。 2. 全局路径规划（Route Planning）全局路径规划是指在给定车辆当前位置与终点目标后，通过搜索选择一条最优的路径，这里的“最优”包括路径最短，或者到达时间最快等条件。这一过程类似于我们生活中经常用到的“导航”功能，区别在于自动驾驶中使用的高精地图与我们常见的地图不太一样，在高精地图中包含了每条车道在内的更多信息。常见的全局路径规划算法包括 Dijkstra 和 A 算法，以及在这两种算法基础上的多种改进。 Dijkstra 算法[3]和A*算法[4]也是在许多规划问题中应用最为广泛的两种搜索算法。图2. 全局路径规划示意 1. Dijkstra 算法 Dijkstra 算法是由计算机科学家Edsger W. Dijkstra 在1956 年提出，用来寻找图形中节点之间的最短路径。在Dijkstra 算法中，需要计算每一个节点距离起点的总移动代价。同时，还需要一个优先队列结构。对于所有待遍历的节点，放入优先队列中会按照代价进行排序。在算法运行的过程中，每次都从优先队列中选出代价最小的作为下一个遍历的节点。直到到达终点为止。 Dijkstra 算法的优点是：给出的路径是最优的；缺点是计算时间复杂度比较高（O(N2) ）, 因为是向周围进行探索，没有明确的方向。 2. A*算法为了解决 Dijkstra 算法的搜索效率问题，1968 年，A 算法由 Stanford 研究院的Peter Hart, Nils Nilsson 以及Bertram Raphael 发表，其主要改进是借助一个启发函数来引导搜索的过程。具体来说，A 算法通过下面这个函数来计算每个节点的优先级: 其中： f(n) 是节点 n 的综合优先级。当我们选择下一个要遍历的节点时，我们总会选取综合优先级最高（值最小）的节点。 g(n)是节点n 距离起点的代价。 h(n) 是节点n 距离终点的预计代价，这也就是A*算法的启发函数。 3. 行为决策（Behavioral Layer）在确定全局路径之后，自动驾驶车辆需要根据具体的道路状况、交通规则、其他车辆与行人等情况作出合适的行为决策。这一过程面临三个主要问题：首先，真实的驾驶场景千变万化，如何覆盖？其次，真实的驾驶场景是一个多智能体决策环境，包括主车在内的每一个参与者所做出的行为，都会对环境中的其他参与者带来影响，因此我们需要对环境中其他参与者的行为进行预测；最后，自动驾驶车辆对于环境信息不可能做到 100%的感知，例如存在许多被障碍物遮挡的可能危险情形。综合以上几点，在自动驾驶行为决策层，我们需要解决的是在多智能体决策的复杂环境中，存在感知不确定性情况的规划问题。可以说这一难题是真正实现 L4、L5 级别