基于神经网络印刷体数字识别算法探究.docVIP

下载本文档

2
0
约2.61千字
约 6页
2017-08-05 发布于福建
举报
版权申诉

基于神经网络印刷体数字识别算法探究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于神经网络印刷体数字识别算法探究

基于神经网络印刷体数字识别算法探究摘要印刷体数字识别(Printed Numeral Recognition)是光学字符识别技术(Optical Character Recognition, OCR)的一个分支，是文字识别的重要组成部分。本文以VC为平台，运用人工神经网络的思想（主要采用BP神经网络），实现了对印刷体数字识别。关键词数字识别；图像预处理；特征提取；神经网络引言目前,识别技术已经广泛地应用到了各个领域中。为了达到对一幅图像中的数字进行识别的目的，我们要对图像进行一些处理，这些处理工作的好坏直接决定了识别的质量，这些处理技术依次为图像的读取、对读取的图像进行灰度变换、按照量化指标对灰度变换后的图像进行二值化、然后对二值化后的图像中的字符信息进行切分等。在进行完上述预处理工作后进行特征提取，再输入到已经训练好的BP网络进行识别。 1 识别的流程识别的流程按照引言中的步骤进行，主要分为两大部分，第一部分为图像的预处理、第二部分为通过神经网络进行印刷体数字的识别。预处理部分的流程：图像输入-灰度变换-图像二值化-紧缩重排-归一化调整-图像分割-特征提取。神经网络数字识别的具体流程：样本训练-字符特征输入-识别并给出结果。 2 基于神经网络的特征提取算法概述图像在经过了前期的预处理后，由原来杂乱无章的字符变为了整齐排列的、大小相同的一列字符，在这里图像归一化后的宽度为8像素，高度为16像素，这样就大大方便了对字符特征的提取。我们把提取的特征存储在特征向量里，然后把特征向量输入到神经网络中，这样就可以对字符进行识别了。由以上的论述我们可以得出结论，特征提取的算法是整个识别过程的关键，它的好坏直接决定了识别的成败。对图像中的字符进行特征提取的算法有很多，下面对几种重要的分别进行介绍。 2.1骨架特征提取法由于图像的来源不同，这就使得图像的线条所使用的像素不同，在图像上表现出来就是线条的粗细的不同，这样就使得它们的差别很大。如果我们将不同的图像统一到相同的像素水平，那么它们的差别也就不那么明显了。我们使用骨架特征提取算法，就会使得识别具有一定的适应广度和宽度。 2.2逐像素特征提取法这种图像的特征提取算法是最为常用的方法，它的特点是能够保留图像中的全部特征信息，不过这种特征提取算法对图像的噪声较为敏感，对原始图像的质量要求较高，它采用逐行扫描的办法，对图像进行扫描，为整个图像建立一个以图像中的像素个数相同的特征向量矩阵。矩阵值为0或1，图像中的黑色像素记为1，白色像素记为0。 2.3垂直方向数据统计特征提取法此算法是对逐像素提取算法的改进，他使得特征向量矩阵的维数降低，便于后期的识别。该算法首先对图像进行水平扫描，在这一过程中，统计没一列的黑色像素数，然后进行对图像进行垂直扫描，并记录每一行上的黑色像素数，对于一个字符宽度和长度为W和H的字符，他的特征向量的维数就为W+H。 2.4特征点提取法这一特征提取算法首先对字符进行分割，利用实现设定的四条线将字符分为八个部分，分别统计每个部分中黑色像素的数目，可以得到八个特征。然后统计水平和垂直两个方向上，穿过四条线的黑色像素数，得到四个特征，最后将整个图像中黑色像素的数目作为一个特征，一共得到十三个特征。该方法具有很强的适应性，但是由于特征点较少，使得在样本的训练过程中很难收敛。可以看出，识别算法各有特点，根据实践需要，本识别算法中的特征提取算法采用逐像素特征提取法。原因是这种算法的执行效率高，方法简单容易实现，且对于神经网络来说有很快的收敛性，具有较好的训练效果。 3 BP网络进行数字识别算法设计 BP网中中各层中的节点数是设计BP网络最基本的一点，对于神经网络的输入层而言，其节点数为经过图像预处理里后特征向量的维数。可以直接利用每个点的像素值作为特征，这里特征提取采用逐像素提取法，归一化后图像的宽度为8，高度为16，因此对于输入样本来说，每一个样本都会由128个特征，因此神经网络的输入层的特征数为128。对于神经网络内部隐藏层的节点数来说，其节点数没有特别的规定，总的来说，隐藏层的神经元的数目与神经网络的精度成正比，与训练时间成反比。如果神经网络的神经元设置的过多，会对识别率造成较大影响，使得识别率大幅下降。因此在这里根据多年的实践经验在神经网络的隐藏层选取10神经单元。对于输出层而言，要根据设定的输出标准来确定输入层的节点数。在本算法中采用8421的编码进行编码。对于0-9这十个数字，分别对应十个8421码，例如，0的8421码为（0,0,0,0），1的8421码为（0,0,0,1），依次类推，因此神经元的数目选定为4，就可以表示这十个数字，然而，因为神经元的激励函数（传输函数