- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于深度学习的自监督单目深度估计方法研究
摘要
三维环境感知在许多现实应用中扮演着重要角色,如自动驾驶、AR/VR和机器人等
相关应用。深度信息是三维环境感知的关键信息,如何高效并准确地获取它一直是人们
所关注的问题。尽管激光雷达等深度传感器可以很容易地获取到深度信息,但是大多数
深度传感器仍然代价昂贵,而基于学习的深度估计方法能够以较低的代价获取到深度信
息,因此得到了广泛研究。基于完全监督的深度估计方法能够取得较高的准确度,但是
需要依赖高精度的深度传感器来获取深度真值作为监督信息,这就限制了这些方法的使
用。自监督单目深度估计只需要一台相机,以目标帧与合成视图之间的光度重投影误差
作为监督,其训练过程无需依赖深度真值,这使得它们应用起来更加方便,因而得到了
广泛的关注。本文研究了基于视频序列的自监督单目深度估计算法,针对目前自监督单
目深度估计方法存在的问题,提出了两个有效的解决方案。本文的主要工作及贡献如下:
(1)基于谱非局部机制和自适应激活的单目深度估计。现有的单目深度估计方法
广泛采用基于U-Net的编解码架构,然而编码器不断的下采样会引起空间细节的丢失,
导致最终的深度图在细节上缺失。另外,卷积算子作为卷积神经网络的关键组件,擅长
建模局部关系,难以有效地建模远程依赖关系。为解决这些问题,本文提出在网络中引
入一种“图谱域”视角下的非局部机制——谱非局部机制,由于它考虑了特征的图特性,
因此除了捕获远程依赖关系,还有利于捕获特征中的结构化信息。另外,通过在网络中
应用自适应的meta-ACON激活,根据输入来确定是否激活神经元,以及给神经元多大
程度的激活,来进一步地提高模型的性能。结果表明了所提方案的先进性,促进了场景
结构和深度细节的精确推断。
(2)基于多尺度特征融合的单目深度估计。为应对深度估计任务中物体尺度变化
以及小目标带来的挑战,本文设计了多尺度特征融合模块,模块中包含两条支路,分别
是全局上下文支路和局部上下文支路,全局上下文支路采用了频率通道注意力,引入了
更丰富的低频信息,在此基础上添加了局部上下文支路,由于它关注特征的每个空间位
置的通道间交互,因此有效避免了小目标的特征被削弱。将两条支路的结果广播相加,
得到的权重具有与输入特征相同的形状,这种元素级的动态选择的方法有效缓解了场景
中物体尺度变化和小目标所带来的影响。在KITTI和Cityscapes数据集上的实验结果证
明了本章方法的先进性和有效性。
哈尔滨工程大学硕士学位论文
关键词:自监督学习;单目深度估计;谱非局部机制;自适应激活;多尺度特征融合
基于深度学习的自监督单目深度估计方法研究
ABSTRACT
3Denvironmentalperceptionplaysanimportantroleinmanyreal-worldapplications,
suchasautonomousdriving,AR/VRandrobotics.Depthinformationisthekeyinformationfor
3Denvironmentalperception,andhowtoefficientlyandaccuratelyobtainithasalwaysbeen
concernedbyresearchers.Althoughdepthsensorssuchaslidarcaneasilyobtaindepth
information,mostdepthsensorsarestillexpensive.However,learning-baseddepthestimation
methodscanobtaindepthinformationatalowcost,sotheyhave
文档评论(0)