- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                数字的识别方法研究
                    数字的识别方法研究
图像的预处理
彩色图像的灰度化
图像输入后一般都是256色彩色图像,因为256色位图调色板内容复杂,很多算法无法进行,所以要进行彩色图像的灰度化。灰度化后灰度图像的RGB值是相等的,只有亮度的不同,灰度值大的像素亮度也大,灰度值小的图像亮度暗,灰度值为255的像素为白色,灰度值为0的像素为黑色。
灰度图像的二值化
彩色图像灰度化后每像素只有一个值,即灰度值,二值化就是根据一定标准将图像分成黑白二色。因为我所做的是扫描图像,所以用给定阈值法,给定阈值为220。
梯度锐化
因为二值化后的图像字体模糊,所以有必要进行梯度锐化。梯度锐化同时对噪声也起一定的去除作用,在这里采取Roberts算子对图像锐化,可以让模糊的边缘变清楚,同时选用合适阈值可以减弱和消除细小的噪声。
4、去离散噪声
由于图像的扫描和传输过程可能夹带噪声,所以需要去离散噪声。具体方法是:扫描整个图像,当发现一个黑色像素就考察和它直接或间接相连的黑色像素有多少,如果大于一定值(具体数值视情况定),就可以认为它非离散点,否则就认为他是离散点,将其从图像中去掉。
中值滤波技术
中值滤波是一种典型的低通滤波器。它的目的是保护图像边缘的同时,去除噪声。所谓中值滤波就是把以某点(x,y)为中心的小窗口内的所有像素的灰度按从大到小的顺序排列,将中间值作为(x,y)处的灰度值,若窗口内有偶数个像素,则取两个中间值的平均值作为灰度值。
倾斜度调整
倾斜度调整是为了使字符处于同一水平位置,有利于图像的分割。根据左右两边黑色像素平均高度来判定图像是否倾斜。如果平均位置有较大起落,则判定图像倾斜。调整方法是:分别计算出左右像素的平均高度,再求斜率,根据斜率重新组织图像里包含从新图到旧图的像素的映射。如果新图中像素映射到旧图超出旧图范围,则将超出旧图范围的像素置白色。
图像分割
图像识别只能根绝每个字符的特征进行识别。所以要对图像进行分割。具体方法如下:
(1)、自下而上和自上而下对图像进行逐行扫描,当分别找到第一个黑色像素点时,找到图像的高度范围。
(2)、对图像进行自左而右逐列扫描,当遇到第一个黑色像素点时,认为是该字符的开始,直到一列没黑色像素出现时,认为该字符分割结束。然后继续扫描,直到图像的最右边。
(3)、在已知每字符宽度范围内再重复第一步,则可以确定每字符的高度范围。
归一化调整
因为扫描的字符大小存在差异而对同一尺寸的图像进行识别准确率高一些,所以要进行归一化调整。归一化方法是先得到原来字符的高度,并与系统要求的高度比较,得出高度变换系数,然后根据这个系数得到变换后应有的宽度,得出高度、宽度后,把新图像里的点按照插值的方法映射到原图像,为了以后特征提取方便,进行BP网络训练时缩短训练时间,高和宽不宜设置过大。这里取高为m,宽为n。
9、图像的紧缩重排
归一化处理后,字符在图像中位置不定,对以后的特征提取比较麻烦,所以有必要对图像里的字符进行紧缩重排,以形成新的位图句柄。紧缩重排由函数AutoAlian()实现。
至此,完成对图像的预处理。
模式识别
  (一)、特征提取
   经过预处理,把原来大小不同、分布不规律的各字符变成大小一样、排列整齐的字符。下面要从预处理完的字符中提取最能体现这一个字符的特征向量,将提取出的训练样本中的特征向量代入BP网络中就可以对BP网络进行训练。提取出待识别的样本中特征向量代入训练好的BP网络中就可以进行识别。在这里采取逐像素特征提取法,方法是对图像进行逐行逐列扫描,当遇到黑色像素时,取其特征值为1,当遇到白色像素时,取其特征值为0。这样扫描结束后就形成一个维数与图像中像素点的个数相同的特征向量矩阵。
(二)、BP神经网络
设计BP网络的关键在于高效的特征提取方法、大量有代表性的样本及高效稳定速收敛的学习方法。
BP网络的学习过程算法可归纳如下:
第一步,设置变量和参数,其中包括训练样本、权值矩阵、学习速率等等;
第二步,初始化,给各个权值矩阵一个较小的随机非零向量;
第三步,随即输入样本;
第四步,对输入样本前向计算BP网络每层神经元的输入信号和输出信号。
第五步,由实际输出和期望输出求得误差,判断是否满足要求,若满足则转向第八步,否则转向第六步。
第六步,判断是否已经到了最大迭代次数,若到,转向第八步,否则反向计算每层神经元的局部梯度。
第七步,根据局部梯度修正各个矩阵的权值。
第八步,判断是否学习完所有的样本,是则结束,否则转到第三步。
2、BP网络的设计及其编程实现
BP网络的任务是要设计并训练出一个可行、高效的BP网络,以实现对0~9共10个数字的识别。
经过图像预处理之后,可以将最终提取到的字符特征送入BP网络进行训练及识别了。在归一化整理中,字符高度和宽度分别为m、n,那么对于每个字符就有m*n维的特征。
三个
                 原创力文档
原创力文档 
                        

文档评论(0)