基于FRCNN 以及合成数据的车标LOGO 识别
蒋子航 姚沛恩
摘要:
本文在Keras 框架下基于RetinaNet 构造的基本识别网络,经过多层的特征学习,由神
经网络直接完成汽车标志的定位回归以及识别分类。训练集共计6000 张左右图片,包括比
赛官方提供的1132 张标注数据的图片以及5000 张合成的图片。合成图片由5000 张左右不
含车标的背景图片与共 30 类的车标LOGO 图片由算法合成,合成过程中采用了各种变换以
求提高识别度。
复赛采用50000 张验证集,采用常用的mAP (mean average precision)进行评价,达
到0.35 的分类加定位准确率。并且识别速度为300ms 每张(2G gpu)理论上在更多的计算
资源条件下还有很大的提升空间。
关键词:
数据合成;定位;识别;FRCNN
0. 引言
随着互联网的发展,相比于文本数据,图像和视频数据的占比越来越高。如何处理图片
数据,对图像的分析识别也变得越来越重要。在企业服务领域,广告监测和舆情监测是企业
重点关注的方向,而识别图像中的品牌LOGO 则是对图像内容做监测的基础。
最近几年,深度学习在物体识别领域取得了巨大的进步,在
原创力文档

文档评论(0)