面向数字字符识别的粗糙集属性约简算法研究-控制理论与控制工程专业毕业论文.docxVIP

  • 1
  • 0
  • 约6.51万字
  • 约 75页
  • 2019-05-08 发布于上海
  • 举报

面向数字字符识别的粗糙集属性约简算法研究-控制理论与控制工程专业毕业论文.docx

面向数字字符识别的粗糙集属性约简算法研究摘要 面向数字字符识别的粗糙集属性约简算法研究 摘要 属性选择是机器学习的核心问题之一,它关系到归纳算法的复杂性和学习 性能。与目标概念不相关的或受噪声干扰的属性会严重降低学习效果,而粗糙 集属性约筒是一种有效的消减冗余属性、选择与目标概念强相关属性子集的方 法。由于经典Rou曲集主要面向nominal attrIbute对象,处理通常包含噪声利 干扰数据的数值型对象时有很大局限。本文的研究内容主要集中于Rough集理 论对数值型属性对象的约简算法及其在数字字符识别中的应用,结合属性选择 的基本准则提出面向数值属性约简的评价函数并设计对应的搜索算法,这些约 简算法完全适用于nominal at打ibute。 具体研究工作如下:一.在Rough集的基本算法方面,提出了计算等价类 的快速算法和增量算法以及计算正区域的改进算法,分析了算法的时间复杂度; 改进了最短属性约简GA的适应度函数,引入特定有效位变异算子,以提高GA 搜索效率。二.针对数据集包含噪声和干扰问题,提出利用属性同类一致性选 择抗干扰属性。定义了两种结合一致性的属性重要度:1.熵函数形式的类内一 致性判据如,度量同类样本属性分布的随机性;2.根据样本同类相似和不同 类相异概率定义的属性综合分辨力w(·)。这两种属性重要度都利用数据的统 计特征,克服了经典Rou曲集属性约简对噪声敏感的缺点。在搜索算法方面设 计了如的全局优化算法、filter算法和以w(·1为启发式知识的sDAR约简算 法,这些约简算法的目的是获得高度同类一致性的属性子集,导出覆盖率高的 规则库。三.探讨了Rou曲集理论应用于数值属性对象的局限性,采用相似关 系粗集模型对连续数值属性对象分类,设计了相似关系数值属性约简算法 sDAR.sIMR。该算法通过相似性阀值控制不同类样本的间隔,是一种可控的直 接约简连续数值属性的算法。四.用上述约简算法对车牌字符和手写数字mfeat 数据集约简,导出分类规则,分别用规则匹配和最近邻法识别。实验表明,与 常用约简算法相比,本文提出的结合属性一致性的约简算法可以获得相对少的 规则,并且规则匹配度、字符识别率较高。 关键词:粗糙集、属性约简、属性选择、一致性、分支定界、过滤算法、遗传算法、 相似关系粗集模型、字符识别 The The research of Rough Set Attribute Reduction AIgorithm in Numeral Character Recognition Abstract The selection of attributes,which inv01ves the complexitV and performance of induction algo rithms,js a central problem in machine 1earning Rough set model are good at selecting target concept feleVant attributes and eliminating surplus ones that would deteriorate induction methods prediction ability The crisp Rough set deals with nominal attribute objects o ri舀nall y, and have many 1imitations in handling cardinal attfibutes objects.The fbcus of this article i cardinal att ributes oriented reduction algorithm and its appIjcation in numeral character recognition First seVeral basic algo rithms of Rough set methods are in”oduced with an analysis of the time complexity such as some e衢cient and incremental computing of indiscernibly relatiOn and an improved algorithm of positive region The fitness function of the shortest reduction GA is analyzed By denning new 6tness function and introducing spec

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档