基于粗糙集的车牌字符特征提取方法探讨.docxVIP

  • 1
  • 0
  • 约5.78千字
  • 约 9页
  • 2019-07-17 发布于广东
  • 举报

基于粗糙集的车牌字符特征提取方法探讨.docx

基于粗糙集的车牌字符特征提取方法探讨 2008年第6期 No,6,2008 九江学院学报 JournalofjiujiangUniversity (总第149期) (SmnNO149) 基于粗糙集的车牌字符特征提取方法探讨 舒彤舒田华余香梅 (九江学院电子_Y■程学院江西九江332005) 摘要:本文介绍了一种基于粗糙集理论的优化车牌字符识别的方法.粗糙集理论是 种继神经元网络和模糊数学Z后的新的处理含糊和不确定性知识的数学工具;粗 糙集方法 是一种具有发展潜力的智能信息处理方法.木文主要思想就是在汉字的网格特征 提取过程 中保持分类能力不变的前提下,通过知识约简提出了一种车牌字符网格特征选择 的改进算 法;它不仅找出了对识别最有效的网格特征集,而且可以大大降低图像特征空间的 维数, 减少工作量和无用特征干涉,从而提高了分类识别率. 关键词:粗糙集;字符识别;分类;知识约简;特征 中图分类号:TP391.4文献标识码:A文章编号:1673—4580(2008)06—0036 一(o4) 粗糙集(Roughsets)是由波兰数学家乙Pawlak于 1982年提出的一种数据分析理论-2J.1991年乙Pawlak 的专着《粗糙集一一关于数据推理的理论》(RoughSets 一 TheoreticalAspectsofReasoningaboutData)较好地总结 了这一时期的RS理论与实践的研究成果,促进了它们的 进-步发展.粗糙集理论是一种刻划不完整性和不确定性 的数学工具,能有效地分析不确定,不一致,不完整等各 种不完备信息. 在国内外,粗糙集理论成为信息科学最为活跃的研究 领域Z—,被广泛应用于人工智能,模式识别,语言识 别,医辽数据分析,各种智能信息处理等领域,并取得了 丰硕的成果J? 粗糙集的一个重要特点是具有很强的定性分析能力, 直接从给定问题的描述集合出发,而不需要预先给出某些 特征或属性的数量描述;从不可分辩关系和不可分辩类确 定给定问题的近似域,从而找出该问题中的隐含知识,揭 示内在规律. 与其它的分类方法不同,粗糙集将知识与分类有机地 联系在一起,建立了知识就是一种对对象进行分类的能力 的概念?在汽车车牌字符识别屮,字符的点阵可以被认为 是一个知识表达系统,我们所求的字符特征就是属性,运 用粗糙集的有关知识可对知识进行约简. 在汽车车牌字符识别中通常采用字符的粗网格特 征,粗网格特征反映了字符的整体形状分布?但网格的划 分具有一定的困难.若网格划分太细,则汉字的特征维数 过多而产生很多的冗余,其至有吋会把有用的主要分类特 征淹没在大量无用特征之中,造成所谓”特征维数灾难”. 若网格划分太粗,则字符特征维数较小,分类能力相应较 弱.而且通过进一步分析不难发现,在字符特征网格中并 不是所有网格对分类都是同等重要的?因此,合理选择网 格字符的网格特征是OCR中一个至关重要的步骤[51 . 1基于模糊数学的汉字粗网格特征离散提取 1」汉字粗网格特征 通常粗网格特征提取方法是先把待识别字符进行大小 和位置归一化,再等分为nXn个网格,然后依次统计各 网格内的黑像素(或白像素)的数量,从而取得一个nX n维的网格特征向量.如图1所示. 图la6X6的网格特征示意图 在本文屮将汉字图像的大小归一化为48X48点阵,再 等分为6X6个网格,如图1 口所示,每个网格中含有8X8个 象素点阵?统计各网格中的象素数即可以得到36维的网格 特征向量. 粗网格特征是属于统计特征中的局部特征,又称局部 灰度特征?通过统计每个网格屮的像素数量,使每个网格各 自反映字符的某-部分特征,粗网格特征反映了字符的整 体形状分布?在识别阶段,把各个网格组合起来作为字符的 统计特征以此来识别字符. 从上面的思路上中可以看出粗网格特征的优点是:容 易提取,便于理解的统计特征,适用于字型变化较小或数量 收稿日期:2008—05—16 作者简介:舒彤(1976 一),男,九江学院电子工程系讲师,硕士,从事人工智能方向的 研究. 2008年第6期九江学院学报?37? 有限的字符;其缺点是由于特征维数较多使抗干涉能力差, 运算吋间花费多. 83212344821 52443115036 543623323222 48248524614 54401448408 6130274028 图lb6X6的网格特征向量 1.2基于模糊数学的特征离散化 由于粗糙集只能处理定性的数据或概念类的对象,而 从汉字点阵中提取的汉字特征数据过于分散,所以对从字 符中提取的特征要进行必要的归一化,泛化.为了运算方 便,本文根据车牌的实际情况,运用模糊数学的方法将字符 特征泛化为五个等级,即:少,较少,屮,较多,多五个语言变 量;分别用123,4,5五个数值表示. 为了运算方便,木文对

文档评论(0)

1亿VIP精品文档

相关文档