- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
特征提取在图像处理中应用
特征提取在图像处理中应用
【摘 要】特征在图像处理中起着非常重要的作用。利用特征提取技术来提取图像的特性,通过这些特征可以快速的对字符图像进行分类和识别。我们通过对不同类型的特征和特征提取技术分析,研究在不同的特征类型中哪些特征提取技术最适合的,整个分析研究以字符识别为基础来进行。
【关键词】特征提取;字符识别;模式识别
特征是描述了一幅图像中关于形状的信息,通过对图像的特征提取和处理,使得对图像的分类很容易实现。在模式识别和图像处理中,特征提取是一种特殊的降维处理,主要目的是从原始数据的低维度空间信息表达方式中获得相关的信息。对数据处理算法来说,输入数据处理时间太长,我们认为是数据是冗余的,为了提高处理速度,将着输入数据将转化为精简的一系列特征表达方式(如特征向量),这个过程称为特征提取。常用的特征提取方法有模板匹配、图像转换、图形描述、直方图、几何不变矩、Zernike矩、样条曲线逼近、傅里叶描述、梯度特征和Gabor特性[1]。文中以字符识别为基础进行特征与特征提取技术的研究。
1 特征提取
特征提取尽可能判别和获得特征,而对于特征选择,对原有的特征集的一个子集选择,特征提取重要的一步是分类器的建设,旨在提取每一类特征的相关信息,在这一过程中相关特征从对象、字母中提取出来构成特征向量。然后使用这些特征向量分类器识别输入单元和目标输出单位。特征提取的过程是从原始数据检索最重要的数据,找到特定的一系列参数,这些参数对一个字符来书来说是精确描述并且是独一无二的形状特性的。在特征提取阶段,字符是由特征向量表示。特征提取的主要目标是提取一组特征,实现用最少的特征实现最大化的识别率和对各种各样的相同的符号实例生成类似的特征集。
2 特征选择
特征选择的主要思想是:通过删除弱或无预测信息的特征来选择输入变量的一个子集同时保持分类精度,约翰等人描述了强和弱相关特征的关联性,强相关特征意味着在不损失分类精度情况下是不能被删除。弱相关的特征意味着对分类精度影响不大[2]。
选择最有意义的特性集合是在分类问题处理过程中的至关重要的一步,良好的特征集包含可以从其他对象区分出特定对象的识别信息。特征可分为局部特征和全局特征,局部特征通常是几何特性(凹、凸部分,端点数量、分支、节点等)。全局特征,全局特征,通常拓扑特性(连通性、投影特性等)或统计特性(不变矩等)。
笔迹识别包括宏观和微观两个类型的笔迹特性。宏观特性主要有:基于灰度值的宏观特性(阈值,黑色像素),基于轮廓的宏观特性(内部和外部轮廓),基于斜率的宏观特性(水平,积极的,垂直的),笔划宽度、倾斜度和高度。字符的凹凸特性通过捕捉主要的拓扑和几何特征。微观特性发现不同的作家的笔迹,微观特征有:纵横比,终点数,节点数,形状大小和圈数,宽度和高度的分布,倾斜,形状,平均曲率和梯度特征。
3 特征提取方法的研究
3.1 傅里叶描述
傅里叶变换广泛应用于形状分析,傅里叶变换的系数构成图形的傅立叶描述,这些描述是在频域中表示图形的特征,描述符包含的低频信息表示图形的一般特征,而高频率信息表示图形细节部分。虽然傅里叶变换的系数的数目往往很大,但是该系数的一个子集足以捕捉图形的整体特征。
假设一个特定图形的边界有K个像素,编号从0到K-1,沿着图形轮廓的第K个像素的位置为(xk,yk)。因此,我们可以用两参数方程来描述的图形:
x(k)= xk,y(k)= yk,我们认为,(x,y)的坐标点不在直角坐标系,而是在复平面,表达方式如下:
3.2 主成分分析(PCA)
主成分分析是一种数学方法,采用一个正交变换将一组可能相关的变量转换为一组不相关变量,这些不相关的变量叫做主成分,他们是数据的中心X,计算的协方差矩阵C,获得特征向量和协方差矩阵的特征值U,P,在特征空间的原始数据P=UT?X。
主成分个数小于或等于原始变量的数目,这种转变的方式为,第一主成分尽可能多地具有较高的方差(也就是说,占据尽可能多的数据变化),主成分的数量小于或等于原始变量的数量。这种转变中定义,第一主成分尽可能高方差(即占尽可能多的数据的变化),并且每一个成功的成分又有尽可能高的方差,在与前面计算出的数据正交(不相关的)的约束情况下,步骤计算出PCA变换的数据矩阵X。只有当数据是满足正态分布时,主成分的保证是独立的。
3.3 Gabor滤波器
在空间域和频域中伽柏滤波器具有最佳的定位特性,依据给定的系数矩阵Gabor滤波器提出了一种多分辨率分析的方法[3],在这种方法中,用一个二维Gabor滤波器进行特征提取。Gabor滤波器在空间域是正弦信号调制高斯函数,在频域中是高斯频移。Gabor滤波器可表示为:
Gabor
原创力文档


文档评论(0)