- 0
- 0
- 约1.07万字
- 约 17页
- 2026-03-17 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN117333749A(43)申请公布日2024.01.02
(21)申请号202311382428.2
(22)申请日2023.10.24
(71)申请人浙江大学
地址310058浙江省杭州市西湖区余杭塘
路866号
(72)发明人丁勇孙瑀程华元刘琳琳牛乐乐
(74)专利代理机构杭州求是专利事务所有限公
司33200专利代理师杨亚男
GO6NGO6N
3/0455(2023.01)
3/0464(2023.01)
(51)Int.CI.
GO6VGO6VGO6VGO6T
10/80(2022.01)
10/82(2022.01)20/64(2022.01)7/246(2017.01)
权利要求书2页说明书6页附图1页
(54)发明名称
一种多模态混合的自动驾驶统一3D检测与跟踪方法
(57)摘要
CN117333749A本发明公开了一种多模态混合的自动驾驶统一3D检测与跟踪方法,属于自动驾驶技术领域。本发明主要包括以下步骤:1.不同模态下的BEV特征的生成;2.自适应融合的BEV特征的生成;3.单帧3D目标检测结果的生成;4.单帧3D目标跟踪结果的生成;5.帧与帧之间目标跟踪结果的迭代。基于本发明所提出的统一3D检测与跟踪方法可以将不同的传感器数据融合为统一的BEV特征,将3D目标检测与3D目标跟踪统一为一个整体。相较于使用独立的目标检测与目标跟踪模型,统一模型可以提高实时性、精度和鲁棒性,获得自动驾驶系统性能和安全性的提升。同时还可
CN117333749A
T码语四
T码
CN117333749A权利要求书1/2页
2
1.一种多模态混合的自动驾驶统一3D检测与跟踪方法,其特征在于,包括以下步骤:
步骤(1).输入来自自动驾驶系统的激光雷达和摄像头采集的多模态数据,分别提取不同模态下的BEV特征;
步骤(2).通过步骤(1)中获得的不同模态下的BEV特征,获得融合不同模态下的BEV特征自适应融合权重,生成自适应融合的BEV特征;
步骤(3).通过步骤(2)获得的自适应融合的BEV特征,采用Transformer编码器进行编码,得到当前帧的编码特征;同时,将自适应融合的BEV特征经过候选区域生成网络完成当前帧的3D目标检测任务,生成当前帧的一系列3D候选框;
步骤(4).将当前帧的一系列3D候选框与经过处理的上一帧的目标跟踪结果进行拼接,将拼接结果与当前帧的编码特征共同输入到Transformer解码器,获得当前帧的初始目标跟踪结果;
步骤(5).利用步骤(4)获取的当前帧的初始目标跟踪结果,生成经过处理的当前帧的目标跟踪结果,通过帧与帧之间不断迭代,最终输出整个多帧输入的目标跟踪结果。
2.根据权利要求1所述的多模态混合的自动驾驶统一3D检测与跟踪方法,其特征在于,所述的步骤(1)中输入来自自动驾驶系统的激光雷达和摄像头采集的多模态数据,分别被各自的BEV生成网络转换到一致的BEV视角,生成的不同模态下的BEV特征具有相同的空间分辨率和相同特征维度。
3.根据权利要求1所述的多模态混合的自动驾驶统一3D检测与跟踪方法,其特征在于,所述的步骤(2)包括:
步骤(2.1).由激光雷达模态的BEV特征生成对应的激光雷达BEV特征的自适应融合权重;
步骤(2.2).由摄像头模态的BEV特征生成对应的摄像头BEV特征的自适应融合权重;
步骤(2.3).由激光雷达模态和摄像头模态融合的BEV特征生成对应的激光雷达和摄像头融合BEV特征的自适应融合权重;
步骤(2.4).将上述步骤(2.1)至步骤(2.3)生成的三个自适应融合权重进行数值归一化;
步骤(2.5).通过三种模态的BEV特征以及对应的归一化后的自适应融合权重,获得自适应融合的BEV特征。
4.根据权利要求3所述的多模态混合的自动驾驶统一3D检测与跟踪方法,其特征在于,所述步骤(2.5)具体为:将三种模态的BEV特征分别与其对应的归一化后的自适应融合权重相乘,得到三组与原始BEV特征尺寸相同的BEV特征;对三组BEV特征进行拼接,拼接得到原始BEV特征维度3倍的新BEV特征,再利用MLP网络将新BEV特征的维度转换为与原始BEV特征维度相同的自适应融合的BEV特征。
5.根
您可能关注的文档
- CN118964873B 一种中药饮片的智能筛选方法 (湖南亚飞中药饮片有限公司).docx
- CN118964695B 基于文本向量化的电力系统向量知识库构建方法 (国网信通亿力科技有限责任公司).docx
- CN118964648B 基于人工智能的电力向量知识库增强检索方法及系统 (国网信通亿力科技有限责任公司).docx
- CN118964527B 一种智慧法院的电子案宗内容分析方法及装置 (纽川技术有限公司).docx
- CN118964447B 基于产业园平台的数据挖掘方法及系统 (广州博士信息技术研究院有限公司).docx
- CN118898847B 一种基于注意力导向细节修复的文档图像阴影去除方法 (厦门理工学院).docx
- CN118898068B 一种基于相似度计算的软件与进程匹配方法 (广州市溢信科技股份有限公司).docx
- CN118897539B 基于fpga平台的ddr控制器测试系统及方法 (皇虎测试科技(深圳)有限公司).docx
- CN118897505B 镗孔编程刀位源文件的后处理方法及相关装置、机床系统 (潍柴动力股份有限公司).docx
- CN118897211B 一种船用燃料电池的寿命预测方法 (北京氢璞创能科技有限公司).docx
原创力文档

文档评论(0)