基于深度学习的自监督单目深度估计方法研究.pdfVIP

基于深度学习的自监督单目深度估计方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于深度学习的自监督单目深度估计方法研究

摘要

三维环境感知在许多现实应用中扮演着重要角色,如自动驾驶、AR/VR和机器人等

相关应用。深度信息是三维环境感知的关键信息,如何高效并准确地获取它一直是人们

所关注的问题。尽管激光雷达等深度传感器可以很容易地获取到深度信息,但是大多数

深度传感器仍然代价昂贵,而基于学习的深度估计方法能够以较低的代价获取到深度信

息,因此得到了广泛研究。基于完全监督的深度估计方法能够取得较高的准确度,但是

需要依赖高精度的深度传感器来获取深度真值作为监督信息,这就限制了这些方法的使

用。自监督单目深度估计只需要一台相机,以目标帧与合成视图之间的光度重投影误差

作为监督,其训练过程无需依赖深度真值,这使得它们应用起来更加方便,因而得到了

广泛的关注。本文研究了基于视频序列的自监督单目深度估计算法,针对目前自监督单

目深度估计方法存在的问题,提出了两个有效的解决方案。本文的主要工作及贡献如下:

(1)基于谱非局部机制和自适应激活的单目深度估计。现有的单目深度估计方法

广泛采用基于U-Net的编解码架构,然而编码器不断的下采样会引起空间细节的丢失,

导致最终的深度图在细节上缺失。另外,卷积算子作为卷积神经网络的关键组件,擅长

建模局部关系,难以有效地建模远程依赖关系。为解决这些问题,本文提出在网络中引

入一种“图谱域”视角下的非局部机制——谱非局部机制,由于它考虑了特征的图特性,

因此除了捕获远程依赖关系,还有利于捕获特征中的结构化信息。另外,通过在网络中

应用自适应的meta-ACON激活,根据输入来确定是否激活神经元,以及给神经元多大

程度的激活,来进一步地提高模型的性能。结果表明了所提方案的先进性,促进了场景

结构和深度细节的精确推断。

(2)基于多尺度特征融合的单目深度估计。为应对深度估计任务中物体尺度变化

以及小目标带来的挑战,本文设计了多尺度特征融合模块,模块中包含两条支路,分别

是全局上下文支路和局部上下文支路,全局上下文支路采用了频率通道注意力,引入了

更丰富的低频信息,在此基础上添加了局部上下文支路,由于它关注特征的每个空间位

置的通道间交互,因此有效避免了小目标的特征被削弱。将两条支路的结果广播相加,

得到的权重具有与输入特征相同的形状,这种元素级的动态选择的方法有效缓解了场景

中物体尺度变化和小目标所带来的影响。在KITTI和Cityscapes数据集上的实验结果证

明了本章方法的先进性和有效性。

哈尔滨工程大学硕士学位论文

关键词:自监督学习;单目深度估计;谱非局部机制;自适应激活;多尺度特征融合

基于深度学习的自监督单目深度估计方法研究

ABSTRACT

3Denvironmentalperceptionplaysanimportantroleinmanyreal-worldapplications,

suchasautonomousdriving,AR/VRandrobotics.Depthinformationisthekeyinformationfor

3Denvironmentalperception,andhowtoefficientlyandaccuratelyobtainithasalwaysbeen

concernedbyresearchers.Althoughdepthsensorssuchaslidarcaneasilyobtaindepth

information,mostdepthsensorsarestillexpensive.However,learning-baseddepthestimation

methodscanobtaindepthinformationatalowcost,sotheyhave

文档评论(0)

拥有快乐的你 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档