基于深度学习的单目图像深度估计研究.pdf

下载文档

6
0
约7.49万字
约 66页
2025-06-13 发布于江西
举报
版权申诉
保障服务

基于深度学习的单目图像深度估计研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于深度学习的单目图像深度估计研究

摘要

单目深度估计任务是一种端到端的图像处理任务，从RGB图像中获得深度

信息，在自动驾驶、三维重建、增强现实等方面有着广泛的应用前景。随着深度

学习的发展，深度估计也逐渐成为热点研究课题。根据场景的不同，数据集的采

集方式也不同，由此分为两个方向，一种是以室内场景为主的有监督任务，一种

是以室外场景为主的无监督任务。本文针对不同场景的不同问题，提出了两种不

同的方法，主要创新工作如下：

（1）室内场景的数据采集一般使用结构光相机，深度图获取较为容易，且

深度图的深度值也是稠密的，所以根据这一特点，对于室内的场景本文采取有监

督的深度估计。传统ASPP（空洞空间金字塔池化，atrousspatialpyramidpooling）

模块只考虑了提升卷积感受视野，但ASPP中的每次空洞卷积选取的像素点分

散，会丢失大量像素点间的信息。针对ASPP模块这一弊端提出了一种动态密集

的DSPP（动态空间金字塔池化，dynamicspatialpyramidpooling）模块。该模块

用一种动态卷积代替空洞卷积，结合ASPP的思想，采用不同大小的卷积尺寸，

并结合通道注意力充分利用每一层的特征。优化了ASPP丢失信息的问题。在

NYUDepthv2数据集上与主流算法相比深度图在均方根误差（RMSE）上降低了

12.5%到0.407，并且准确率（δ1.25）提高了3.4%，达到0.875，验证了算法有

效性。

（2）室外场景由于光照影响，结构光相机无法使用，所以一般采用激光测

距的方式。激光测距虽然准确但是获得的深度图是稀疏的点，监督算法需要稠密

的深度图用作监督，所以对于室外的场景本文采取无监督的深度估计。在无监督

深度估计中，场景结构和全局信息都是重要线索。基于CNN（卷积神经网络）

的网络是由多个卷积叠加而成的，这些卷积尺寸通常较小，所以对全局信息的感

知不足，这会导致性能瓶颈和预测深度图中的模糊伪影。本文提出：1）轻量化

自注意模块采用自注意机制来捕获长距离依赖，在不增加额外参数量的情况下获

得了全局视野，以更好的场景理解和丰富的特征表示为后面的模块提供更多的细

节。2）空间注意力模块采用可学习的方法，先从通道这一角度，获取不同的信

息，再从单个特征图的角度，获得全局的细节信息。该模块旨在融合不同角度的

不同信息，从而实现更精确、更清晰的深度估计。这两个模块相辅相成，构成联

合全局信息模块。该模块综合两个模块的优点，优化了CNN在无监督任务上的

不足。在KITTI数据集上与主流算法相比，第一阈值准确率相当，RMSE减少

2.4%，SqRel减少10.7%，效果有较大提升，能够有效的提高无监督深度估计的

效果。

大量的实验验证了本文的方法的有效性，结果表明本文模型在KITTI和NYU

Depthv2数据集上与主流方法相比有明显优势。

关键词：单目深度估计，无监督，深度学习，注意力机制

ResearchonMonocularImageDepthEstimationBasedon

DeepLearning

ABSTRACT

Thetaskofmonoculardepthestimationisanend-to-endimageprocessingtask

thatobtainsdepthinformationfromRGBimagesandhasawiderangeofapplications

inautomaticdriving,3Dreconstruction,augmentedreality,andotherfields.Withthe

developmentofdeeplearning,depthestimationhasgraduallybecomeahotresearch

topic.Accordingtodifferent

您可能关注的文档

文档评论（0）

精品资料 + 关注: 实名认证

内容提供者

温馨提示：本站文档除原创文档外，其余文档均来自于网络转载或网友提供，仅供大家参考学习，版权仍归原作者所有，若有侵权，敬请原作者及时私信给我删除侵权文

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于深度学习的单目图像深度估计研究.pdf