快准狠！Intel论文揭示自家车牌识别算法LPRNet.PDFVIP

下载本文档

332
0
约2.92千字
约 6页
2019-07-05 发布于天津
举报
版权申诉

快准狠！Intel论文揭示自家车牌识别算法LPRNet.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

快准狠！Intel论⽂揭示⾃家⻋牌识别算法:LPRNet 522018年7⽉20 ⽇ (关注52CV——有价值有深度的公众号~) 来⾃⼯业界的最佳实践。⻋牌识别是⼀个⽼⽣常谈的话题，在⼯业界已经得到⼴泛应⽤。当深度学习在各种视觉识别任务上刷新更⾼精度的时候，却常常被认为计算量远⼤于传统⽅法。Intel公司俄罗斯IOTG计算机视觉组的⼯程师最近发布了⼀篇论⽂，揭示了⾃家已经商⽤的⻋牌识别算法，使⽤轻量级深度神经⽹络进⾏⻋牌识别，达到快准狠的新⾼度，即速度超快、精度超准、硬件利⽤率超狠。本⽂来⾃于论⽂《LPRNet: License Plate Recognition via Deep Neural Networks》。⽂章的的第⼀作者已经离开Intel，这篇论⽂是他们17年的⼯作，通过 Linkedin得知，两位作者来⾃Intel收购的Itseez公司，也就是之前维护 OpenCV的俄罗斯公司。该⽂提出了LPRNet – ⾃动⻋牌识别的end-to-end⽅法，识别之前⽆需进⾏初步的字符分割。该⽅法使⽤了深度神经⽹络，能够实时运算，在中国⻋牌识别准确度上⾼达95％，速度上在nVIDIA GeForce GTX 1080显卡运算每个⻋牌3ms，在英特尔酷睿i7-6700K上每个⻋牌1.3ms。LPRNet由轻量级卷积神经⽹络组成，因此可以端到端的⽅式进⾏训练。论⽂称， LPRNet是第⼀个不使⽤RNN的实时⻋牌识别系统。因为速度快，LPRNet 算法可⽤于⾃动⻋牌识别的嵌⼊式解决⽅案，即使在具有挑战性的中国⻋牌上也具有⾼精度。需要说明的是，LPRNet解决的是识别的问题，⽂中⻋牌检测使⽤的是 LBP-cascade。 LPRNet特性 1.实时、⾼精度、⽀持⻋牌字符变⻓、⽆需字符分割、对不同国家⽀持从零开始end-to-end的训练； 2.第⼀个不需要使⽤RNN的⾜够轻量级的⽹络，可以运⾏在各种平台，包括嵌⼊式设备； 3.鲁棒，LPRNet已经应⽤于真实的交通监控场景，事实证明它可以鲁棒地应对各种困难情况，包括透视变换、镜头畸变带来的成像失真、强光、视点变换等。⻋牌识别的挑战图像模糊、很差的光线条件、⻋牌数字的变化（⽐如中国和⽇本的⻋牌有⼀些特殊字符）、⻋牌变形、天⽓影响（⽐如⾬雪天⽓）、⻋牌上的字符个数有变化。空间变换预处理LocNet 这是对检测到的⻋牌形状上的校正，使⽤ Spatial Transformer Layer[1]，这⼀步是可选的，但⽤上可以使得图像更好得被识别。 LPRNet的基础构建模块 LPRNet的基础⽹络构建模块受启发于SqueezeNet Fire Blocks[2]和 Inception Blocks[3],如下图所示。特征提取⻣⼲⽹架构⻣⼲⽹将原始的RGB图像作为输⼊，计算得到空间分布的丰富特征。为了利⽤局部字符的上下⽂信息，该⽂使⽤了宽卷积（1×13 kernel）⽽没有使⽤LSTM-based RNN。⻣⼲⽹络最终的输出，可以被认为是⼀系列字符的概率，其⻓度对应于输⼊图像像素宽度。由于解码器的输出与⽬标字符序列⻓度不同，训练的时候使⽤了CTC Loss[4]，它可以很好的应对不需要字符分割和对⻬的end-to-end训练。为了进⼀步提⾼性能，使⽤了论⽂[5]中global context嵌⼊。推理阶段对上述⼀系列字符的概率进⾏解码，使⽤beam search[6],它可以最⼤化输出序列的总概率。后过滤（post-filtering）阶段，使⽤⾯向任务的语⾔模型实现作为⽬标国家⻋牌模板的⼀组集合，后过滤阶段是和beam search 结合⼀起⽤的，获得通过beam search找到的前N个最可能序列，返回与预定义模板集合最匹配的第⼀个序列，该模板取决于特定国家的⻋牌规则。识别实验结果训练时，使⽤⼀个来⾃监控场景的中国⻋牌的私有库，总共有11696幅经过LBP级联检测器检测出来的⻋牌，并进⾏了数据增⼴（data augmentation）即随机旋转、平移、缩放，下图报告了上述各种tricks对识别精度的影响。最⼤的识别精度增益来⾃于global context （36%），其次是data augmentation （28.6%），STN-based alignment即预处理也带来了显著提⾼（2.8-5.2%），Beam Search联合post-filtering进⼀步提⾼了0.4- 0.6%. 识别速度 Intel将LPRNe