- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于迁移学习的交通场景车辆实时检测算法
摘要:为实现精确实时的车辆检测,本文算法基于迁移学习思想,以深度学习实时检测算法YOLOv2为基础。使用在大规模数据集上预训练得到的分类模型初始化YOLOv2卷积神经网络,搜集交通场景车辆图片并标注后输入该网络利用反向传播进行微调,从而得到最终的车辆检测模型。测试结果表明,本文算法在包含300张车辆图片的测试集中MAP达到0.788,每帧检测平均耗时15ms,满足工程应用实时性要求。
关键词:迁移学习;车辆检测;卷积神经网络;YOLOv2
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2018)04-0123-02
车辆检测作为智能交通规划中的关键基础技术,一直以来都是国内外研究的热点。近年来,伴随着国内机动车数量的快速增长,我国道路交通状况日趋复杂,实现精确实时车辆检测的难度不断增加。
传统的车辆检测方法基于机器学习,由于监控视频中的车辆特征随着光照、视角等因素的变化而变化,使用HOG、SIFT等常用特征泛化能力较差。因此工程应用中需要针对具体应用场景进行特征设计,为了获取更高的准确率,特征维度越来越高,大大降低了算法实时性,因此传统车辆检测方法在实用中一直难以取得突破性进展。
近年来,随着大规模数据集的不断构建以及硬件计算能力的持续增强,深度学习理论和实践得到迅速发展。2014年,R-CNN[1]首次将深度学习应用到检测领域,后续出现了该类方法的改进,但均无法实时运行。在工程应用中,实时性非常重要,由此出现了基于回归的深度学习目标检测方法,典型代表为YOLO[2]、SSD[3]和YOLOv2[4],能够实现实时检测。
根据交通场景中车辆检测对准确率和实时性的要求,本文以YOLOv2算法作为基础,结合大量交通场景车辆样本数据,实现了基于迁移学习的车辆实时检测算法。实验结果表明每帧图像检测平均耗时15ms,不仅显著提高了识别准确率,而且满足工程应用的实时性需求。
1 YOLOv2算法简介
YOLOv2是基于回归的目标检测方法,通过在图像上运行一次深度卷积神经网络前向计算,同时预测得到其中目标的位置和类别。由于将候选框提取、特征提取、目标分类、目标定位统一于同一卷积神经网络中,YOLOv2不仅训练过程中能够实现端到端的优化,而且检测过程耗时少,能够满足实时处理需求。
2 实时车辆检测算法
基于迁移学习的交通场景车辆实时检测算法分为训练阶段和检测阶段。训练阶段基于迁移学习,首先使用在大规模数据集上预训练得到的分类模型初始化YOLOv2卷积神经网络,然后将车辆图片数据及其标注信息输入卷积神经网络利用反向传播对网络参数进行微调,从而得到最终的车辆检测模型。检测阶段输入待检测交通场景图片,通过训练阶段得到的检测模型计算其中包含的车辆位置及其类别概率,并输出最终检测到的车辆目标信息。整个算法流程图如图1所示。
2.1 迁移学习简介
在深度学习领域,由于获取并标注足量的训练样本用于从头开始训练整个卷积网络成本十分昂贵,因此实践中通常应用迁移学习的思想把已训练好的模型参数迁移到新的模型来帮助新模型训练。首先使用在开源的大规模数据集上预训练得到模型初始化卷积神经网络,然后使用特定场景的训练样本对卷积神经网络进行微调,通过继续反向传播来优化卷积神经网络参数,从而得到最终的深度学习模型。由于大部分数据或任务是存在相关性的,所以通过迁移学习可以将已经学到的模型参数分享给新模型从而加快并优化模型的学习效率。
2.2 检测模型训练
2.2.1 训练集构建
训练集是迁移学习能否取得良好效果极为重要的因素。本文收集了大量交通场景下的车辆图片,对图片中车辆出现的位置进行标注。所收集的图片包含白天、夜间等不同的关照条件,涵盖晴天、雨雪天等不同的天气环境,覆盖目标尽可能多的尺度和形状变化,保证了训练样本的多样性。
2.2.2 初始候选框选取
本文统计了训练集中所有目标标注框的宽度和高度数据,通过k-means++算法对其进行聚类,得到最能表征训练集中目标宽高比信息的候选框尺度。表1所示为各个初始候选框的尺度,其中宽度比和高度比是初始候选框尺寸与检测区域尺寸的比值。交通场景中车辆图片正面和背面位置框近似为正方形且像素占比较小,侧面位置框近似于长方形且像素占比较大,与表1中初始候选框尺度数据一致。
2.3 车辆检测
检测阶段流程图如图2所示,首先将需要车辆检测的图片缩放到416×416,并将其划分为13×13的检测区域,针对每个检测区域预测得到5个目标候选框,采用非极大值抑制剔除无效候选框,最终得到图片中包含车辆目标。
3 算法效果
3.1 运行环境
本文算法运
原创力文档


文档评论(0)