基于特征矩阵高效数字识别算法.docVIP

下载本文档

6
0
约2.85千字
约 6页
2017-11-19 发布于福建
举报
版权申诉

基于特征矩阵高效数字识别算法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于特征矩阵高效数字识别算法

基于特征矩阵高效数字识别算法　　摘要：传统的数字识别算法存在识别速度、识别准确率和识别方法复杂度三者无法兼顾的问题，为解决该问题，提出了基于特征矩阵的高效数字识别算法。该算法首先在预处理的基础上获取字符的特征矩阵，然后用特征矩阵对字符的特征横线、竖线等特征进行提取，最后利用结构语句识别的方法实现数字识别。实验结果表明，基于特征矩阵的高效数字识别算法思路简单、速度快，且识别率达97% 以上。关键词：特征矩阵；数字识别；图像处理；识别率中图分类号：TP312 文献标识码：A 文章编号文章编号2014）001005903 作者简介作者简介：徐敬（1989-），女，北方民族大学电信学院硕士研究生，研究方向为嵌入式与信息处理；刘炜（1963-），男，北方民族大学电信学院副教授、硕士生导师，研究方向为智能仪器。 0 引言数字识别技术是图像处理领域中的一个研究热点，在食品、化妆品、药品等外包装生产日期提取上具有重要的实用价值。近年来，随着人们对数字图像识别算法的不断研究，数字图像识别方法也越来越多，主要有基于神经网络数字图像识别[1]、基于最小距离法的数字图像识别，以及基于模板匹配的数字图像识别[2]。在实际应用中，人们发现数字识别算法的识别率一般较低，个别识别率较高的算法比较复杂，且收敛速度普遍较慢，缺少两方面性能皆优的方法。针对目前存在的问题，结合印刷体数字的特点，笔者提出了一种基于特征矩阵的高效数字图像识别算法。该算法首先在预处理的基础上提取字符的特征矩阵，利用特征矩阵对简单的特征[34]（横线）进行提取，然后应用结构语句识别方法将数字中的多数识别出来。再采用排除法缩小识别数字的范围，并对其中的数字特征凹陷区域进行分析和比较，同时采用上述同样的方法对数字进行识别使算法简单，识别速度快且识别效果好。 1 数字图像预处理图像预处理是对采集到的图像画面在进行数字识别之前所做的一些相关工作，主要包括图像灰度化、二值化、梯度锐化、中值滤波、分割、归一化、细化等步骤，具体流程如图 1 所示。对图像进行预处理非常必要，它能够有效地去除图像噪声，减小各类干扰对图像识别的不利影响，为特征提取和识别奠定了基础。图像预处理的每一步结果如图2-图9所示。图1 数字预处理流程图2 原始图像图3 灰度化图4 二值化图5 梯度锐化图6 中值滤波图7 分割图8 归一化图9 细化 2 数字识别算法经过细化之后，通过从上到下，从左到右对图像进行扫描，提取字符的特征矩阵。由于细化后矩阵的边界可能存在全为0的行或列，为了便于后续特征提取，需要将其全为0的行列全部删除，得到类似如图10所示的矩阵，记为juzhen[m][n]。设前景像素为1，背景像素为0。对0～9这10个印刷体数字，首先可以根据是否存在横线将数字分为两个子集，其中1、2、4、5、7存在横线记H=1。0、3、6、8、9不存在横线记H=0。在H=1的集合中，因为横线存在的位置不同，可以将其再分为3个子集：1、2存在下横线；5、7存在上横线；4横线位置记为其它。这样数字识别的范围又进一步缩小了，接下来可以在小范围内进行特征比较来实现数字的识别。如5、7特征比较发现，5上半部分存在左凹陷区，下半部分存在右凹陷区。对于凹陷区域的识别可以依据矩阵在凹陷区域内像素值为0，限定区域范围统计0的行数即可，该区域范围仅针对每个特定数字而言，这样5就可以识别出来，运用排除法7自然而然也被识别出来。1、2特征比较发现，1存在竖线，2没有这个特征，4不需进行特征比较即可得出结果，为了使识别结果更加准确，可以加上竖线这个特征。在H=0的集合中，0的结构较简单，特征也较明显，把它作为一个集合来对待。它是一个封闭的圆圈，圆圈内没有像素则通过矩阵在一个较大区域内像素1的个数小于阈值的范围来提取。3、8、6、9作为另一个集合，特征比较发现，3上、下两部都存在右凹陷区，6上半部分存在左凹陷区，9下半部分存在右凹陷，除此之外就是8。这10个数字中的1较特殊，有的字体底部没有横线，有的底部存在横线，所以除了上述判断还要考虑没有横线的情况。数字识别流程如图11所示，其中上半部分左凹陷区域记为上左，上半部分右凹陷区记为上右，下半部分右凹陷区域记为下右，下半部分左凹陷区域记为下左。识别顺序按照从上到下、从左到右进行。对于易识别错误的字符进行了多处特征比较，如字符3、5等。数字特征提取条件如表1所示，特征的提取需要用到以下自定义函数： 3 实验结果与分析在上述数字图像预处理基础上，利用上述识别算法对图像进行数字识别，结果保存在文本文件中，图像识别的结果如图12所示。图12 数字识别结果