- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
车辆属性识别及跨场景标注的方案
车辆属性识别及跨场景标注的方案
摘要:提出采用一种基于深度学习的识别方法,来辅助获取训练模型中所需要的车辆属性标签。该方法首先利用海报图像构建大规模车辆属性数据集(SYSU-ZTE-CARS),训练基于卷积神经网络(CNN)的识别模型,再将模型迁移到监测控制场景中进行标注测试,间接获取属性标签。采用CNN+softmax分类器的结构作为基本框架,引入细粒度识别技术以进一步优化识别性能。利用5种常用车辆属性进行测试,实验结果表明:所提出的方案不仅在SYSU-ZTE-CARS数据集上的识别精度高,而且在监测控制场景下的标注结果也很可靠。
关键词: 精细化属性识别;CNN;深度学习;计算机视觉
智能交通[1-2]领域中牵涉到很多计算机视觉的任务,需要对海量的视频、图像数据进行处理、分析。在基于车辆视频图像的分析任务中,传统技术不仅效率较低,耗费巨大的人力、物力、财力,而且欠缺对数据的感知表达能力,没有充分利用数据、挖掘数据特性,以致分析精度不够高。引入车辆属性识别的方法,可以增强算法对目标车辆特征的理解和表达能力,大大提高分析任务的可靠性和效率。
随着计算机视觉和机器学习技术的发展,以它们为技术基础的新一代智能分析技术,在目标检测、识别、检索等任务中表现优越,能够极大地减少人力成本,提高监测控制的效率,有巨大的应用潜力。
自2012年ImageNet[3]国际大规模视觉识别比赛以来,业界掀起了一波基于计算机视觉和深度学习的识别技术研究和应用热潮。深度学习是一门大数据驱动的技术,我们通常认为:提供训练的数据量越大,所训练得到的模型性能越好;而在视频监测控制的应用场景下,海量的视频图像数据会源源不断地产生,因此将深度学习技术应用在视频监测控制领域,恰能发挥其先天优势以及视频数据的作用。
基于深度学习的属性识别技术,通常以卷积神经网络(CNN)为基本工具。CNN模型参数的学习,目前使用最广泛也是最稳定的方法是有监督的训练策略。这种策略需要使用大量车辆图片及其属性标签作为训练样本。目前面临最大的挑战是:在现实监测控制场景下的车辆属性标签很难获取。虽然有些属性标签可以通过人工标注的方式获取,如颜色、视角、车类型、品牌等,但是?@种方式同时也带来了新的问题,如:颜色易受光照影响,在极端光照环境下,人眼无法正确判别车辆颜色;品牌往往需要通过车标来确定,一旦车标模糊、被遮挡、不可见,则需要通过人眼来判别车辆品牌。
另一方面,我们注意到:在互联网上有大量带有属性标签的车辆海报图片。为了获取监测控制场景下的车辆属性标签,我们考虑了一种跨场景自动标注的技术方案。该方案中,我们先利用带有属性标签的车辆海报图片训练属性识别模型,再将此模型迁移到现实的监测控制场景中,自动标注出车辆属性。
1 车辆属性识别的相关工作
1.1 车辆属性识别的研究
目前,对于车辆属性的研究工作和应用都已经相当广泛,主要集中于视角识别、颜色识别、车类型识别、品牌识别等几个方面。
在视角识别方面,学术界主要在KITTI基准测试平台[4]上进行。KITTI上的研究绝大部分是基于CNN的,其识别效果精度都非常高,有些优秀的工作如多尺度CNN(MSCNN)[5]、循环滚动卷积(RRC)[6]等,以及一些利用三维信息的工作,能够在直接预测车辆偏转角度的具体数值的任务上有可靠的性能表现。
在颜色识别方面,研究难点在于:光照影响对颜色判断的干扰特别严重。目前主要的研究多是基于强判别性区域辅助的方式,具体实现手段主要包括利用关键点、利用局部分割等。在颜色特征表达上,主要有基于阈值分割、颜色直方图和CNN等。
在车类型识别方面,可以分成两大类:基于非视觉的方法和基于视觉的方法。基于非视觉的方法,业界通常采用如雷达、超声波、红外线等传感器信号开展研究应用;基于视觉的方法则通过通用摄像头采集视频图像数据,再通过计算机视觉技术进行识别。目前的研究主要有基于直方图特征、低维投影特征和稀疏表示特征等传统方法。
在品牌与子品牌识别方面,研究成果同样也可以分为传统方法和深度学习方法两大类。传统方法主要是通过传统特征工程的手段人工设计特征,如Curvelet变换、方向梯度直方图(HOG)特征、分层梯度直方图(PHOG)特征、边缘方向直方图(EOH)特征、Gabor小波等,也有基于融合特征进行稀疏编码的解决方案。深度学习方法,主要是基于CNN特征对属性进行判别的,也有一些针对细粒度识别的工作,如Part-based R-CNN 模型、基于分割图辅助的CNN模型、双线性CNN模型等。
总体来说,基于传统方法的车辆识别技术都有特征设计过程反复、特征表达能力鲁棒性差、模型泛化能力差的缺点;而基于深度学习的车辆属性识别技术,则具有强大的
文档评论(0)