基于数字图像识别算法设计.docVIP

下载本文档

126
0
约2.97千字
约 7页
2018-06-23 发布于福建
举报
版权申诉

基于数字图像识别算法设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于数字图像识别算法设计

基于数字图像识别算法设计　　【摘要】本文以数字识别系统的基本流程为主线，从数据的提取与预处理、特征的提取与选择，到分类器的设计等部分都进行了较为详尽的分析与研究。着重研究了几个主要的用于分类的算法如最小距离法、近邻法、K-近邻法和BP神经网络，并通过MATLAB仿真实验分析了不同算法的识别率。为工程应用提供了可靠的理论依据和实际的使用经验。　　【关键词】最小距离法；近邻法；K-近邻法；BP神经网络　　1.引言　　模式识别是人类的一项基本智能，人们每时每刻都在进行着“模式识别”。随着计算机技术的普及和发展，让计算机拥有识别能力收到越来越多的研究学者的重视，也是人工智能和机器人技术发展的前提。　　模式识别是指对表征事物或现象的各种形式的（数值的、文字的和逻辑关系的）信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分[1]。生活中最简单的事物无过于简单的数字0-9，同时，数字在各个方向领域应用广泛，如：车牌识别，邮政编码识别等。因此，数字字符识别是一项有实际应用的课题。　　2.数字识别基本步骤　　数字识别是通过读取所需识别的数字图片的特征值输入到某个已经定义好的识别算法中进行识别，并输出识别结果，其基本步骤如图2-1所示。　　如图2-1所示，数字识别步骤主要有：数据提取、数据预处理、特征值提取和选择以及分类器和分类决策。下面分别对这几个步骤进行分析。　　2.1 数据提取　　本文所处理的为0-9的灰度图片，总共有400组图片，分为0-9的数字十组，每组40个，分为30个训练样本和10个测试样本。本文借助matlab软件自带的imread函数和dir函数对“数字”文件夹下的所有图片进行读取，获得一个包含图片数据的36*20*40*10的四维数组。每幅图片的数据为36*20的数据矩阵。　　2.2 预处理　　图像预处理要根据实际图像进行相应操作，以便使处理时间和正确率两者结合起来。一般而言，预处理的目的是为了去除图像中所包含的干扰噪声，增强有用信息，对退化的信息进行复原。图像预处理包含以下一系列操作：图像去噪处理、图像二值化??理、分割处理和归一化处理等。具体步骤如图2-2所示。　　2.2.1 二值化　　一般设备读取得到的数字图像均为灰度图像，需对其进行二值化处理，使之变为仅含黑（1）、白（0）两种颜色的二值图像，这对于加强图像对比具有很好的效果。二值化后的图像其字符与背景对比更为强烈，更加突显字符的结构特征。对灰度图像二值化能减小数据存储的容量，降低处理的复杂性。对数字字符图像二值化，要求二值化后的图像能真实地再现原本数字，要求笔画中不出现空白点，并且二值化的笔画基本保持原来文字的结构特征。本文采用matlab自带的二值化处理函数：im2bw，阙值选择0.5。　　2.2.2 去噪处理　　噪声的存在恶化了图像质量，使图像模糊，更严重的甚至是图像的特征完全被淹没，以致于给图像识别和分析带来了困难。因此，对图像进行去噪处理是为了去除图像中包含的干扰噪声，加强图像有用信息的对比，为获取更好的特征值打下良好的基础。　　2.2.3 分割和归一化　　为了得到每个图像的特征，需要对二值矩阵进行分割和归一化。图像分割算法一般是基于亮度值的两个基本特性之一：不连续性和相似性。第一类性质的应用途径是基于亮度的不连续变化分割图像，比如图像的边缘。第二类性质的主要应用途径是依据事先制定的准则将图像分割为相似的区域。图像分割是大多数识别步骤中的一个基本的预备性步骤。选择一种分割技术而不选择另一种主要是由所面对问题的特点决定的[2]。本文针对数字图像的特性：阿拉伯数字不存在左右型和上下型结构，每个数字都是独立的个体，所以在分割时可先进行行切分，再进行列切分。初次切分是把矩阵按行分成两部分，列分成两部分。针对错误率后期再进行优化。　　2.3 特征值提取与选择　　特征值的提取与选择主要是针对已经分割好的矩阵块进行特征值的统计，其主要目的是从分析数字的拓扑结构入手，把它的某些结构特征提取出来，使数字的位移、大小变化、字形畸变等干扰相对减小，而把那些反映数字特征的关键信息提供给分类器。特征的选择一般有以下原则：首先是充分性原则，即所抽取的特征要能充分保持原模式的信息量；其次在满足充分性的基础上，尽量减小特征维数；此外，抽取特征时所花费的计算量不能太大，否则将影响识别速度。本文就实际情况，统计分割后的每个矩阵块中的黑像素的数量作为该矩阵块的特征值，并以此作为表征该图像的特征值。　　3.数字识别方法　　从模式识别作为一项学科开始至今，研究学者们提出了各种各样的识别方法。本文主要针对最小距离法、近邻法、K-近邻法和BP神经网络进行了理论研究，