CN116229448B 三维目标检测方法、装置、设备及可读存储介质 (东风汽车股份有限公司).docxVIP

  • 0
  • 0
  • 约1.59万字
  • 约 23页
  • 2026-01-21 发布于重庆
  • 举报

CN116229448B 三维目标检测方法、装置、设备及可读存储介质 (东风汽车股份有限公司).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN116229448B(45)授权公告日2025.07.11

(21)申请号202211733172.0

(22)申请日2022.12.30

(65)同一申请的已公布的文献号申请公布号CN116229448A

(43)申请公布日2023.06.06

(73)专利权人东风汽车股份有限公司

地址441199湖北省襄阳市高新区东风汽

车大道劲风路3幢

(72)发明人晏萌郭启翔何薇陈晖刘磊胡博伦高宠智屈紫君李嫩

付浩

(74)专利代理机构武汉智权专利代理事务所(特殊普通合伙)42225

专利代理师罗成

(51)Int.CI.

GO6V20/64(2022.01)

GO6V10/764(2022.01)

G06T7/50(2017.01)

GO6N3/08(2023.01)

GO6V10/82(2022.01)

GO6V10/80(2022.01)

GO6N3/0464(2023.01)

(56)对比文件

CN114266900A,2022.04.01审查员杨珺

权利要求书2页说明书8页附图2页

(54)发明名称

三维目标检测方法、装置、设备及可读存储介质

(57)摘要

CN116229448B本申请涉及一种三维目标检测方法、装置、设备及可读存储介质,包括基于DORN算法对RGB图像进行处理得到深度估计图及其预测目标中心点深度值;通过RGB图像、深度估计图以及预测目标中心点深度值对预设神经网络模型进行训练生成目标检测模型,目标检测模型中的局部卷积核基于深度估计图生成,目标检测模型中的损失函数用于约束回归二维包围框与三维框的关系;将待检测图像输入至目标检测模型得到目标三维框。本申请结合图像的深度估计图生成自适应于目标样本位置的局部卷积核,以有效捕获上下文信息,提高三维目标检测算法的鲁棒性和准确性;同时利用深度估计图的目标中心深度值来构建二维框与三维框的几何约束监督,以有效提升算法

CN116229448B

基于

基于DORN算法对RGB图像

进行处理,得到深度估计图及其预测目标中心点深度值

通过RGB图像、深度估计图

以及预测目标中心点深度值对预设神经网络模

型进行训练,生成目标检测模型,所述目标检测模型

中的局部卷积核基于深度估计图生成,所述目标检测模

型中的损失函数用于约束回归二维包围框与三维框的关系

将待检测图像输入至所述目标检测模型,得到目标三维框

CN116229448B权利要求书1/2页

2

1.一种三维目标检测方法,其特征在于,包括以下步骤:

基于DORN算法对RGB图像进行处理,得到深度估计图及其预测目标中心点深度值;

通过RGB图像、深度估计图以及预测目标中心点深度值对预设神经网络模型进行训练,生成目标检测模型,所述目标检测模型中的局部卷积核基于深度估计图生成,所述目标检测模型中的损失函数用于约束回归二维包围框与三维框的关系;

将待检测图像输入至所述目标检测模型,得到目标三维框;

其中,所述损失函数Lotal为:

Loa=(1-S)(Ls+L??+L?D+Laph)

Lagph=2.L(zkepu,[z]b)

式中,S,表示目标分类的得分,Y表示损失函数的聚焦参数,Lcs表示分类损失,L?D表示二维边界框的回归损失,L?D表示三维边界框的回归损失,Laepth表示深度估计图的预测损失,λ表示权重,L表示SmoothL1损失函数,[21kigph表示预测目标中心点深度值, [z]?D表示真实目标中心点深度值;

其中,通过反向S函数定义不同距离的权重λ,权重λ的计算公式为:

式中,s为距离阈值,其对应函数的中心对称点,T为函数弯曲度,depi为目标检测模型中的RPN网络预测得到的深度。

2.如权利要求1所述的三维目标检测方法,其特征在于:所述预设神经网络模型包括上支特征提取网络和下支卷积核生成网络,所述上支特征提取网络包括改进后的ResNet-50网络、RPN网络和深度引导卷积模块。

3.如权利要求2所述的三维目标检测方法,其特征在于:所述改进后的Re

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档