角钢钢印字符识别方法的研究综述.docxVIP

下载本文档

6
0
约5.37千字
约 9页
2023-08-21 发布于浙江
举报
版权申诉

角钢钢印字符识别方法的研究综述.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

? ? 角钢钢印字符识别方法的研究综述 ? ? 何迅，刘小芳（四川轻化工大学计算机科学与工程学院，自贡 643000） 0 引言随着信息技术的飞速发展和现代工业生产技术的不断进步，人类已经进入了一个全新的工业时代。目前国家电网也在大力推广工业智能化，而如何将智能化引入传统制造业是当今乃至今后一段时间内的重要课题。角钢是国家电网建设的重要材料之一，角钢钢印字符便是角钢的身份标识，也是人们用来识别角钢型号的依据。一个完整的高架铁网需要不同型号的角钢组成，而不同型号的角钢所需的数量也不同，人工对成堆角钢钢印字符进行识别记录时很容易造成失误从而降低效率，人工造成的失误会耗费大量的人力物力成本去重新匹配正确的型号组合，在如今信息化的时代这样的方式极为低效。受益于图像识别技术的高速发展，字符识别已经应用于社会的许多领域，角钢钢印字符识别便是将智能化带入传统制造业的重要途径之一，为日后解决工业角钢仓储管理信息化、出入库自动化等场景问题提供重要的技术思路。 1 研究背景及意义在图像处理领域中字符识别是一个重要的研究方向。字符识别的方法是对图像中字符信息进行定位、识别和提取，然后输出结果让计算机和人们理解。现如今字符识别技术已经应用于人们生活中的多个方面，如快递单号[1]、证件信息[2]、纸质文档[3]、打印发票[4]、汽车车牌[5]等。而工业环境下的角钢钢印字符与此不同，角钢有更为复杂多变的字符背景。角钢字符是一种钢印字符，相比于打印字符特征更加难以泛化，并且字符表面存在锈迹、磨损和字迹不清等干扰；字符图像存在相机设备与工厂加工设备工作振动导致字符抖动的影响。面对复杂的工业环境和角钢字符表面的干扰，人工设计特征定位提取字符再识别的传统算法很难应对。总的来说，角钢字符背景环境复杂、干扰因素多、人工检测效率不高且无法满足工业需求，传统算法角钢字符特征提取困难。所以，使用如今高速发展的深度学习可以很好地解决这个问题。相机定点采集角钢字符数据集，利用深度学习训练检测与识别模型，开发角钢钢印字符识别系统，从而提高角钢字符的识别，促进工业智能化发展。 2 研究现状及存在的问题光学字符识别（Optical Character Recognition，OCR）是一门科学，能够将各种类型的文档或图像转换为可分析、可编辑和可搜索的数据[6]。OCR 的设想最早起源于20世纪20年代末，由奥地利的工程师Tauschek[7]提出，并获得了技术专利，这是OCR 概念首次出现在历史上。纵观OCR 迅速发展的几十年，在深度学习流行于识别领域前，OCR多使用传统算法。传统的字符识别算法是定位和分割单个字符，然后利用人工设计的特征训练分类器。分割算法决定了最终识别结果的质量，常见的分割算法一般基于连通域和垂直投影[8-10]。图像二值化后，分割算法通过连通域或灰度直方图分割字符。背景简单、风格规整的字符对此有不错的效果，但对于像角钢字符一样背景复杂的字符很难达到好的效果。于是有的研究者开始探索另一条道路，如Girshick 等[11]提出R-CNN模型，便标志着深度学习[12]与OCR 技术结合道路的开始。随后Hinton 课题组使用深度学习创建了AlexNet[13]，在ImageNet 图像识别比赛上一举夺冠，并且碾压第二名采用SVM 方法的分类性能，这一成果吸引了众多学者开始关注深度学习，此后深度学习的发展进入爆发性增长，更多的研究人员将OCR 技术与深度学习结合在一起，一些具有优秀性能的网络结构被提出[14-16]，基于深度学习的各种文本检测和文本识别模型也逐渐涌现。文本检测模型方面，Tian 等[17]提出CTPN 模型可以检测水平和轻微倾斜的文本，水平长文本的检测效果也更好，CTPN 模型是在Faster-RCNN 的基础上移除ROI 层，引入anchor 机制，并加入RNN 网络对检测目标的位置偏移量和置信度分数的计算；CTPN 模型的检测效果很好，但是由于加入了RNN 导致网络速度会比较慢。Zhou 等[18]提出EAST 模型，采用端到端的训练方法，直接将OCR常用的多阶段简化为两个阶段，大大提高了网络的执行速度。此外，由于该模型设置的检测框可以是任意四边形，致使EAST能够检测倾斜文本，但扭曲文本EAST 仍然存在不足。之后Liao 等[19]提出DBNet 模型，解决了EAST 模型不能识别扭曲文本的问题，该模型在基于分割的文本检测中，不同于之前需要指定二值化阈值，该模型可以自适应地对每一个像素点进行二值化，并通过从网络学习得到二值化阈值，直接将二值化步骤添加到网络中一起训练，大大提高了输出图对于二值化阈值的鲁棒性，从而达到高性能和高准确度。近年来扭曲文本的检测仍在提高，Zhu 等[20]提出傅立叶轮廓嵌入（Fourier Co