基于深度学习的印刷体文档字符识别的研究.docx

下载文档

0
0
约6.95千字
约 8页
2024-09-23 发布于湖北
举报
版权申诉
保障服务

基于深度学习的印刷体文档字符识别的研究.docx

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于深度学习的印刷体文档字符识别的研究

徐长英赖伟财陈英

摘?要：针对传统基于模板匹配光学识别效果存在不理想的状态，提出改进的深度学习模型的印刷体文档字符识别算法。首先，生成包括一级字库、部分二级字库、英文大小写字母和标点符号的图片数据集，其数量大约为500万张;然后，在Lenet?5网络模型的基础上进行改进和重新构造，提出一种增强型的深度学习模型Lenet?5Pro，该模型可提高印刷体文档的识别率;最后，对比实验结果表明，该模型可以更加有效地提高印刷体字符识别的准确率，其字符识别准确率达到98%以上。

关键词：印刷体字符识别;深度学习;图片数据集;Lenet?5Pro;字符增强;仿真分析

：TN911.73?34;TP391?????????文獻标识码：A?????????：1004?373X（2020）23?0072?04

Abstract：Inviewoftheunsatisfactoryeffectofthetraditionalopticalrecognitionbasedontemplatematching，aprinteddocumentcharacterrecognitionalgorithmbasedonimproveddeeplearningmodelisproposed.Apicturedatasetincludingthefirst?levelfontlibrary，partofthesecondaryfontlibrary，Englishupperandlowercaseletters，andpunctuationmarksisgenerated，inwhichabout5millionpiecesofpicturesarecollected.AnenhanceddeeplearningmodelLenet?5Pro，bywhichtherecognitionrateofprinteddocumentscanbeimproved，isproposedbasedontheimprovementandreconstructionofLenet?5networkmodel.Thecomparativeexperimentalresultsshowthattheaccuracyofcharacterrecognitioncanbeimprovedbytheproposedmodel，anditscharacterrecognitionaccuracyisover98%.

Keywords：printeddocumentcharacterrecognition;deeplearning;imagedataset;Lenet?5Pro;characterenhancement;simulationanalysis

0?引?言

印刷体文档字符识别是光学字符识别（OpticalCharacterRecognition，OCR）技术的重要组成部分，印刷体文档的识别基本用途是把图片输入计算机，计算机输出识别字符，实现人与计算机信息的交互。文献[1]利用卷积神经网络构建了印刷体汉字识别模型，使用集成了传统OCR识别技术的MODI（MicrosoftOfficeDocumentImaging）进行身份证汉字识别。文献[2]提出了一种基于深度信念网络融合模型对手写汉字识别的方法，简单的汉字使用基于SVM（SupportVectorMachine）的二次判别函数分类器识别，使用深度信念网络模型处理较为复杂的汉字图像。文献[3]使用基于神经网络反馈的方法对所提取的文本行基于像素点进行判断而进行二值化，结合垂直投影方法对字符切分，提高OCR识别率。文献[4]提出了一种无分割的端到端神经模型，用于离线光学字符识别，结合卷积神经网络（ConvolutionalNeuralNetwork，CNN）和长期短期记忆（LongShortTermMemory，LSTM）复发网络，使用CNN进行特征提取，并使用堆叠的双向LSTM进行序列建模。文献[5]提出了一种基于前馈人工神经网络（ArtificialNeuralNetwork，ANN）的OCR算法，使用神经网络训练的对象特征数据集改进基于OCR的车牌识别技术。文献[6]提出了STN?OCR，以半监督方式从自然图像中