2025【基于深度神经网络的汉字识别研究的国内外文献综述3900字】.docx

下载文档

0
0
约4.46千字
约 4页
2025-04-09 发布于湖北
举报
版权申诉
保障服务

2025【基于深度神经网络的汉字识别研究的国内外文献综述3900字】.docx

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于深度神经网络的汉字识别研究的国内外文献综述

1.1汉字识别系统概述

二十一世纪初，已经研发出识别率较高的联机手写汉字识别系统，它能够保存书写的笔顺信息，获取时间空间顺序从而实现，但是脱机手写汉字识别的发展遭遇瓶颈，当时世界上并没有足够完善的脱机手写汉字识别方法。随着深度学习的兴起，计算机计算能力的增长，依托于图像识别技术的进步，在2012年，瑞士人工智能实验室描述了具备“端-端”特点的多列卷积神经网络模型(MCDNN)。在多列卷积神经网络中，利用GPU训练深度神经网络的模型，同时平均集成卷积神经网络的输出；将所得到的手写汉字样本转换成图像类别，并通过已搭建的模型训练。在训练的过程中，不采用进一步地特征选择、提取，所得到的最终结果便是卷积神经网络希望得到的识别结果[2]。在脱机和联机手写汉字识别方面，多列卷积神经网络模型能够很好地胜任模式识别工作，当时的识别技术都位居当时世界识别水平的前列，为手写汉字识别问题提供了更加完善的解决方案。尽管以多列卷积神经网络模型为代表的卷积神经网络模型简便且具备比较优秀的识别能力，但缺点也是较为明显的，端到端的识别方法不能全面的利用手写文字的已有研究成果，例如联机手写汉字中的笔顺信息、汉字方位转换特点等，这些手写汉字的特征是利用本卷积神经网络无法进一步学习来实现的。

近年来，伴随着卷积神经网络（Convolutionalneuralnetworks，CNN）的模型理论不断完善，对于它的研究方向也朝着多方面发展。对运行速度和存储容量的优化是非常重要的一个方面，因此涌现了许许多多优化升级CNN模型的方法。中国科学家设计出一种9层CNN，该网络采用了全局监督低维扩展（GSLRE）方法，使神经网络能够拥有更高的计算速度更小的模型大小，利用自适应权重（ADW）技术，使得网络仍能达到超过90%的识别率。尽管精度有所下降，但是仅仅只是下降了0.21%，却大大减少了计算量。在CNN的识别过程中，图像噪声也会对识别率产生一些影响——虽然CNN力求最简便的输入，更完美的识别系统应当可以在这方面进行进一步地优化。在最新的JournalofPhysics:ConferenceSeries杂志上发表的一篇基于CNN和中值滤波的手写体汉字识别进行了有关噪声处理对CNN手写汉字识别系统的优化，中值滤波在散斑噪声、椒盐噪声的处理中有很好地表现。因此首先通过中值滤波法，实现对图像的去噪声处理过程，再将处理后的图片信息应用到CNN，以此获得更高的识别率[3]。

如今，国内互联网公司也推出了各种手写汉字识别服务，但对于风格迥异的手写汉字，仍不能做到始终使得汉字识别率维持在极高的水平，要做到精确识别不同风格的手写汉字，仍需要投入更大的精力。

1.2深度神经网络概述

深度神经网络已经在我们日常生活中最为常见的信息处理领域，如语音、文字、图像等方面，获得了极大的成功[4]。日新月异的计算机理论带来的是这个世界翻天覆地的变化，计算机计算能力的飞速发展，使得深度神经网络已经具备足够的可行性和可用性，现代的优秀工程师们，已经通过各种技术手段，搭建不同的深度神经网络，将它应用到许许多多的不同领域，并且在各个领域都拥有者举世瞩目的成就。深度学习可谓独领风骚于音视频领域上，现今的所有商用语音识别背后，都有着深度学习的影子。除此之外，深度学习使得图像识别变得极为简便，大大提高了现今的图像识别能力，识别率相较之前的技术有了长足进步，甚至使得目前对于图像识别的准确率不属于人工识别。就图像识别这个领域而言，他的应用已经涵盖了我们生活的方方面面，应用最广的就是为我们所熟知的人脸识别，指纹识别等，这些都是深度学习在生物特征识别技术上的成果。而在自然语言理解方面，深度学习也大显身手。当下较为火热的无人车技术，智能问答，天气预报等，都在深度学习的帮助下有着质的飞跃[5]。

深度神经网络的起源一般以1994年的LeNet5为起点，LeNet5是最早的卷积神经网络，孕育着未来发展的无限可能。LeNet5最大的特点就是定义了卷积神经网络的基本特征，即它的层次模型。首次利用卷积操作实现图像特征的提取，子采样利用了图空间平均技术，而在激活层之中使用了Sigmoid函数和tanh函数来进行非线性整流操作。LeNet5可以说是深度神经网络的开山鼻祖。尽管如此，受限于当时的计算水平，深度神经网络的发展遭遇了一个瓶颈期。但是，相关的研究人员没有放弃，缓慢地推动着深度神经网络的持续发展。一直到2010年，国外科学家DanClaudiuCiresan和JurgenSchmidhuber接过深度神经网络发展的接力棒，使得深度神经网络再度进入大众视野，并开启了深度神经网络蓬勃发展的黄金时代，他们成功搭建了基于NVIDIAGTX280GPU图形处理器的GPU神经网