- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于深度学习的道路场景语义分割技术研究
摘要
在计算机视觉领域上,语义分割实现了图像像素级的分类。它能够将一张图片或
者视频,按照类别的异同,将图像分为多个块。随着图像语义分割技术的不断发展,
激发了很多学者的研究热情。同时语义分割技术在很多的领域都有着广泛的应用,比
如医学影像、遥感图像、自动驾驶等方面。对于自动驾驶而言,对于道路场景的语义
分割技术就变得尤为重要。但现有的道路场景图像的语义分割技术的输出效果存在着
预测精度不高、训练速度慢等问题。所以本文分析以往的网络结构特点,提出了改进
技术在道路场景下的应用。
(1)针对传统U-Net模型在进行道路场景语义分割存在精确度较低的问题,本文
提出了基于DeepLabV3+和U-Net融合的Du-Net网络,对道路场景进行语义分割。Du-
Net是由第一阶段的DeepLabV3+网络结构和第二阶段基于ECA通道注意力模块的U-
Net所构成。将分割图像输入到DeepLabV3+后的输出作为第二阶段基于ECA通道注意
力模块的U-Net的输入,这样使得道路边缘图像会更加细化。在道路场景的应用上,使
图像的道路边缘分割的精确度有了明显提升。
(2)为减少复杂背景对道路图像语义分割的影响,在第二阶段U-Net的编码部分
的三次卷积与池化操作之间嵌入了ECA通道注意力机制,其在编码阶段更好的提升了
特征通道的调节能力,在一定程度上提高了分割精度。
(3)道路场景语义分割的分割速度,是自动驾驶技术不可忽视的考量因素。本文
在第一阶段的DeepLabV3+的骨干网络使用的轻量级的MobileNetV2,并且在第二阶段
的U-Net网络结构的编码阶段采用的四次卷积和池化操作改为了三次,解码部分采用的
四次上采样和卷积操作改为了三次,以提升语义分割的速度,为Du-Net语义分割技术
在自动驾驶的部署上提供了可能性。
最后使用Labelme标注工具对数据集进行标注,通过实验对比基于Du-Net和其他
网络结构的道路语义分割效果,结果显示:基于Du-Net的道路语义分割精确度、准确
度、召回率以及F1的值都有一定的提升。
关键词:深度学习;道路场景;DeepLabV3+;U-Net;语义分割;
基于深度学习的道路场景语义分割技术研究
Abstract
Inthefieldofcomputervision,semanticsegmentationenablestheclassificationofimages
atthepixellevel.Itisabletotakeapictureorvideoanddividetheimageintomultipleblocks
accordingtothesimilaritiesanddifferencesofthecategories.Thedevelopmentofsemantic
imagesegmentationtechniqueshasinspiredmanyscholarstoresearch.Atthesametime
semanticsegmentationtechnologyhasawiderangeofapplicationsinmanyfields,suchas
medicalimaging,remotesensingimages,autonomousdrivingandsoon.Forautonomous
driving,thesemanticsegmentationofroadsceneshasbecomeparticularlyimportant.However,
theoutputeffectofexistingsemanticsegmentationtechniquesforroadsceneshasproblems
suchaslowpredictionaccuracy
文档评论(0)