- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于神经网络印刷体数字识别算法探究
基于神经网络印刷体数字识别算法探究摘要 印刷体数字识别(Printed Numeral Recognition)是光学字符识别技术(Optical Character Recognition, OCR)的一个分支,是文字识别的重要组成部分。本文以VC为平台,运用人工神经网络的思想(主要采用BP神经网络),实现了对印刷体数字识别。
关键词 数字识别;图像预处理;特征提取;神经网络
引言
目前,识别技术已经广泛地应用到了各个领域中。为了达到对一幅图像中的数字进行识别的目的,我们要对图像进行一些处理,这些处理工作的好坏直接决定了识别的质量,这些处理技术依次为图像的读取、对读取的图像进行灰度变换、按照量化指标对灰度变换后的图像进行二值化、然后对二值化后的图像中的字符信息进行切分等。在进行完上述预处理工作后进行特征提取,再输入到已经训练好的BP网络进行识别。
1 识别的流程
识别的流程按照引言中的步骤进行,主要分为两大部分,第一部分为图像的预处理、第二部分为通过神经网络进行印刷体数字的识别。预处理部分的流程:图像输入-灰度变换-图像二值化-紧缩重排-归一化调整-图像分割-特征提取。神经网络数字识别的具体流程:样本训练-字符特征输入-识别并给出结果。
2 基于神经网络的特征提取算法概述
图像在经过了前期的预处理后,由原来杂乱无章的字符变为了整齐排列的、大小相同的一列字符,在这里图像归一化后的宽度为8像素,高度为16像素,这样就大大方便了对字符特征的提取。我们把提取的特征存储在特征向量里,然后把特征向量输入到神经网络中,这样就可以对字符进行识别了。由以上的论述我们可以得出结论,特征提取的算法是整个识别过程的关键,它的好坏直接决定了识别的成败。对图像中的字符进行特征提取的算法有很多,下面对几种重要的分别进行介绍。
2.1骨架特征提取法
由于图像的来源不同,这就使得图像的线条所使用的像素不同,在图像上表现出来就是线条的粗细的不同,这样就使得它们的差别很大。如果我们将不同的图像统一到相同的像素水平,那么它们的差别也就不那么明显了。我们使用骨架特征提取算法,就会使得识别具有一定的适应广度和宽度。
2.2逐像素特征提取法
这种图像的特征提取算法是最为常用的方法,它的特点是能够保留图像中的全部特征信息,不过这种特征提取算法对图像的噪声较为敏感,对原始图像的质量要求较高,它采用逐行扫描的办法,对图像进行扫描,为整个图像建立一个以图像中的像素个数相同的特征向量矩阵。矩阵值为0或1,图像中的黑色像素记为1,白色像素记为0。
2.3垂直方向数据统计特征提取法
此算法是对逐像素提取算法的改进,他使得特征向量矩阵的维数降低,便于后期的识别。该算法首先对图像进行水平扫描,在这一过程中,统计没一列的黑色像素数,然后进行对图像进行垂直扫描,并记录每一行上的黑色像素数,对于一个字符宽度和长度为W和H的字符,他的特征向量的维数就为W+H。
2.4特征点提取法
这一特征提取算法首先对字符进行分割,利用实现设定的四条线将字符分为八个部分,分别统计每个部分中黑色像素的数目,可以得到八个特征。然后统计水平和垂直两个方向上,穿过四条线的黑色像素数,得到四个特征,最后将整个图像中黑色像素的数目作为一个特征,一共得到十三个特征。该方法具有很强的适应性,但是由于特征点较少,使得在样本的训练过程中很难收敛。
可以看出,识别算法各有特点,根据实践需要,本识别算法中的特征提取算法采用逐像素特征提取法。原因是这种算法的执行效率高,方法简单容易实现,且对于神经网络来说有很快的收敛性,具有较好的训练效果。
3 BP网络进行数字识别算法设计
BP网中中各层中的节点数是设计BP网络最基本的一点,对于神经网络的输入层而言,其节点数为经过图像预处理里后特征向量的维数。可以直接利用每个点的像素值作为特征,这里特征提取采用逐像素提取法,归一化后图像的宽度为8,高度为16,因此对于输入样本来说,每一个样本都会由128个特征,因此神经网络的输入层的特征数为128。
对于神经网络内部隐藏层的节点数来说,其节点数没有特别的规定,总的来说,隐藏层的神经元的数目与神经网络的精度成正比,与训练时间成反比。如果神经网络的神经元设置的过多,会对识别率造成较大影响,使得识别率大幅下降。因此在这里根据多年的实践经验在神经网络的隐藏层选取10神经单元。 对于输出层而言,要根据设定的输出标准来确定输入层的节点数。在本算法中采用8421的编码进行编码。对于0-9这十个数字,分别对应十个8421码,例如,0的8421码为(0,0,0,0),1的8421码为(0,0,0,1),依次类推,因此神经元的数目选定为4,就可以表示这十个数字,然而,因为神经元的激励函数(传输函数
原创力文档


文档评论(0)