字符识别的神经网络方法研究.docVIP

下载本文档

4
0
约8.35千字
约 15页
2021-01-12 发布于北京
举报
版权申诉

字符识别的神经网络方法研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

字符识别的神经网络方法研究摘要：深度学习(Deep Learning)在机器学习领域中是一种重要的方法，也是在近年来越来越受到关注的一门机器学习算法。随着神经网络技术的飞速发展，在目标检测、语义检测、情感识别、图像分割、图像分类等领域取得了不少突破性的进展。卷积神经网络是深度学习领域中的一项非常重要的网络结构，它是一个前馈神经网络。人工神经元可以响应周围的神经单元，具有许多传统神经网络结构所不具备的优异特性。本文针对手写数字字符数据集，利用深度神经网络构建了LeNet网络进行训练、识别，并对数据进行了不同的数据增强(Data Augmentation)，以此来研究比较最终网络结构的识别准确率。本文的网络结构对手写字符数据集的识别率达到了97.65%，并且在测试其他测试集时表现出了良好的适应性。关键词：深度学习，字符识别，卷积神经网络，模式识别，数据增强前言 AI，也就是我们所说的人工智能，是人类所探求了许多年的终极理想。在最近几年，随着技术的飞跃，我们的生活已经大大地被人工智能技术所改变，但是在目前，还没有任何一台计算机可以达到真正像人类一样拥有自我意识的阶段。图灵在自己1950年的论文中曾经提出过这样一个理论，即被测试者与测试的人或机器分隔在两个不同的房间，如果超过百分之三十的被测试人无法区分开与自己交流对话的是人类还是机器人，那么可以说这台机器已经通过了图灵测试，可以认为它一定程度上拥有了人类的智能。但是，人工智能的发展并没有人们预料的那么顺利，因为技术的发展并没有达到图灵测试的标准，许多计算机科学家对此感到心灰意冷，渐渐开始冷落这项技术，还有些技术员认为这完全是一项遥不可及的伪科学。但是依旧有很多像LeCun这样的计算机科学家没有放弃对这一技术的追求，他们引领了深度学习的重新崛起，在多个领域取得了突破性的进展。利用深度学习的相关算法，让计算机可以从海量的数据集中归纳出相应的特征，在用之前归纳得出的结果模型去匹配其他的样本数据。从网络结构和算法的角度来分类的话，我们大致可以把机器学习的发展分为两个阶段：浅层学习与深度学习。阶段一：浅层学习(shallow learning) BP算法，即反向传播算法是三十年前广受关注的一种算法，科研人员发现它可以在人工神经网络(ANN)中发挥巨大的作用，并且大大的加快了机器学习领域的发展，在那之后有大量的研究人员投身于机器学习的研究和发展之中。并且在当今学术界，仍然有不少的计算机科学家在从事这方面的研究工作。事实上，在一些问题的解决上，BP算法反而有着更加适宜的应用场景。因为在之前更多使用的是基于人工规则的方式，所以这样一种基于统计规则的机器学习算法在很多地方表现出了更加优越的特性。阶段二：深度学习(Deep Learning) 2006年时，多伦多大学教授Geoffrey Hinton发表了一篇产生了巨大影响的论文，在文中提出了以下两个重要的观点：1.当需要处理分类和图像问题时，使用多层神经网络可以对数据的特征进行更充分的学习和表达。2.如果神经网络的隐层层数较多，应该使用逐层训练的方式来解决。本文也主要采用了卷积神经网络来解决图像训练和识别的相关问题。第一章绪论本章首先介绍了深度学习相关领域的研究背景以及研究意义，并陈述了国内外学者的研究现状，主要包括了深度学习以及字符识别的发展历程、目前的研究成果。其次介绍了当前深度学习存在的一些不足，最后简述了论文的组织结构和主要工作。 1.1研究背景及意义在机器学习领域中，深度学习(Deep Learning)是一种很重要的方法，它在语音及图像识别领域已经进行了大规模的商业应用。在过去的几十年中，计算机科学家们一直致力于让计算机变得更加智能，可以像人一样进行思考或用有感情的变化，总而言之，更加近似于人类大脑。目前，深度学习是一个正在飞速发展的领域，许多和我们生活息息相关的应用以及研究方向也随之诞生。在2016年的3月，Google的DeepMind团队与围棋排名世界第一的韩国选手李世石展开了一场举世瞩目的围棋大赛，最终AlphaGo 4:1大胜李世石，为深度学习的广泛传播和快速发展提供了一次极佳的机遇。众所周知，围棋在所有棋类游戏中是属于最复杂的一类，它拥有许多苦难复杂的数学问题，因此不得不说深度学习的发展速度之快令所有人感到震惊。在机器学习的早期发展阶段，它研究和处理的主要内容是对于人类十分困难而对于计算机却又比较简单的任务。在1997年，IBM科学计算中心研究发明的AI超级计算机深蓝击败了国际象棋世界冠军加里卡斯帕罗夫。因为国际象棋的基本规则相对围棋来说更加简单，仅仅含有32个