美团技术解析自动驾驶中的决策规划算法概述【最新版】.pdfVIP

美团技术解析自动驾驶中的决策规划算法概述【最新版】.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
美团技术解析自动驾驶中的决策规划算法概述 1. 引言 在一套完整的自动驾驶系统中,如果将感知模块比作人的眼睛和 耳朵,那么决策规划就是自动驾驶的大脑。大脑在接收到传感器的各 种感知信息之后,对当前环境作出分析,然后对底层控制模块下达指 令,这一过程就是决策规划模块的主要任务。同时,决策规划模块可 以处理多么复杂的场景,也是衡量和评价自动驾驶能力最核心的指标 之一[1]。 图1. 自动驾驶系统中的决策规划模块分层结构,引用自[2] 如图1 所示,典型的决策规划模块可以分为三个层次。 其中,全局路径规划 (Route Planning)在接收到一个给定的行驶 目的地之后,结合地图信息,生成一条全局的路径,作为为后续具体 路径规划的参考; 行为决策层(Behavioral Layer)在接收到全局路径后,结合从感 知模块得到的环境信息(包括其他车辆与行人,障碍物,以及道路上 的交通规则信息),作出具体的行为决策(例如选择变道超车还是跟 随); 最后,运动规划(Motion Planning)层根据具体的行为决策,规 划生成一条满足特定约束条件 (例如车辆本身的动力学约束、避免碰 撞、乘客舒适性等)的轨迹,该轨迹作为控制模块的输入决定车辆最 终行驶路径。 本文将分别介绍各层的主要作用与常见算法,并且比较各种算法 的优劣性及适用情景 。 2. 全局路径规划(Route Planning) 全局路径规划是指在给定车辆当前位置与终点目标后,通过搜索 选择一条最优的路径,这里的“最优”包括路径最短,或者到达时间 最快等条件。这一过程类似于我们生活中经常用到的“导航”功能, 区别在于自动驾驶中使用的高精地图与我们常见的地图不太一样,在 高精地图中包含了每条车道在内的更多信息。常见的全局路径规划算 法包括 Dijkstra 和 A 算法,以及在这两种算法基础上的多种改进。 Dijkstra 算法[3]和A*算法[4]也是在许多规划问题中应用最为广泛的两 种搜索算法。 图2. 全局路径规划示意 1. Dijkstra 算法 Dijkstra 算法是由计算机科学家Edsger W. Dijkstra 在1956 年提出, 用来寻找图形中节点之间的最短路径。在Dijkstra 算法中,需要计算 每一个节点距离起点的总移动代价。同时,还需要一个优先队列结构。 对于所有待遍历的节点,放入优先队列中会按照代价进行排序。在算 法运行的过程中,每次都从优先队列中选出代价最小的作为下一个遍 历的节点。直到到达终点为止。 Dijkstra 算法的优点是:给出的路径是最优的;缺点是计算时间 复杂度比较高 (O(N2) ), 因为是向周围进行探索,没有明确的方向。 2. A*算法 为了解决 Dijkstra 算法的搜索效率问题,1968 年,A 算法由 Stanford 研究院的Peter Hart, Nils Nilsson 以及Bertram Raphael 发表, 其主要改进是借助一个启发函数来引导搜索的过程。具体来说,A 算 法通过下面这个函数来计算每个节点的优先级: 其中: f(n) 是节点 n 的综合优先级。当我们选择下一个要遍历的节点 时,我们总会选取综合优先级最高(值最小)的节点。 g(n)是节点n 距离起点的代价。 h(n) 是节点n 距离终点的预计代价,这也就是A*算法的启发函 数。 3. 行为决策(Behavioral Layer) 在确定全局路径之后,自动驾驶车辆需要根据具体的道路状况、 交通规则、其他车辆与行人等情况作出合适的行为决策。 这一过程面临三个主要问题: 首先,真实的驾驶场景千变万化,如何覆盖? 其次,真实的驾驶场景是一个多智能体决策环境,包括主车在内 的每一个参与者所做出的行为,都会对环境中的其他参与者带来影 响,因此我们需要对环境中其他参与者的行为进行预测; 最后,自动驾驶车辆对于环境信息不可能做到 100%的感知,例 如存在许多被障碍物遮挡的可能危险情形。 综合以上几点,在自动驾驶行为决策层,我们需要解决的是在多 智能体决策的复杂环境中,存在感知不确定性情况的规划问题。可以 说这一难题是真正实现 L4、L5 级别

文档评论(0)

186****5782 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档