基于FRCNN以及合成数据的车标LOGO识别-ofZihangJiang.pdf

基于FRCNN以及合成数据的车标LOGO识别-ofZihangJiang.pdf

基于FRCNN 以及合成数据的车标LOGO 识别 蒋子航 姚沛恩 摘要: 本文在Keras 框架下基于RetinaNet 构造的基本识别网络,经过多层的特征学习,由神 经网络直接完成汽车标志的定位回归以及识别分类。训练集共计6000 张左右图片,包括比 赛官方提供的1132 张标注数据的图片以及5000 张合成的图片。合成图片由5000 张左右不 含车标的背景图片与共 30 类的车标LOGO 图片由算法合成,合成过程中采用了各种变换以 求提高识别度。 复赛采用50000 张验证集,采用常用的mAP (mean average precision)进行评价,达 到0.35 的分类加定位准确率。并且识别速度为300ms 每张(2G gpu)理论上在更多的计算 资源条件下还有很大的提升空间。 关键词: 数据合成;定位;识别;FRCNN 0. 引言 随着互联网的发展,相比于文本数据,图像和视频数据的占比越来越高。如何处理图片 数据,对图像的分析识别也变得越来越重要。在企业服务领域,广告监测和舆情监测是企业 重点关注的方向,而识别图像中的品牌LOGO 则是对图像内容做监测的基础。 最近几年,深度学习在物体识别领域取得了巨大的进步,在

文档评论(0)

1亿VIP精品文档

相关文档