实值信息系统属性约简算法研讨.pdfVIP

  • 2
  • 0
  • 约5.36万字
  • 约 53页
  • 2018-06-07 发布于贵州
  • 举报
实值信息系统属性约简算法研讨

摘 要 属性约简是粗糙集理论的重要应用,也是其核心问题之一。但是,经典粗糙 集理论模型建立在不分明关系(等价关系)基础上,它处理的属性值是清晰的离 散值,而对现实世界中广泛存在的实值信息系统却不能直接处理,即无法利用连 续属性值来建立等价关系,从而使经典粗糙集理论的应用大大受到了限制。因此, 探究实值信息系统的有效属性约简方法显得尤为重要,同时发展这方面的理论也 是十分必要的。 本文首先系统的阐述了粗糙集理论的总体研究情况,深入研究了经典粗糙集 的理论框架、概念基础以及粗糙集理论的核心一知识约简,讨论了知识约简与信 息系统、决策系统的关系。其次,简单介绍了粗糙集的属性约简理论以及现有的 属性约简算法,包括基于可辨识矩阵和逻辑运算算法、基于信息熵的算法和基于 信息量的算法。再次,在总结和借鉴前人研究成果的基础上,针对普遍存在的实 值信息系统,给出了两种不同的实值属性约简算法: 第一种是基于区分矩阵的实值属性约简算法。该方法将经典粗糙集理论对数 据空间的等价划分转换为基于邻域关系的粒化,从而形成论域的一个覆盖,通过 定义对象之间关于单个属性的相似度以及构造区分矩阵,同时应用集合覆盖和属 性约简之间的联系,将实值信息系统的最小属性约简问题转化为最小集合覆盖问 题,给出了实值信息系统最小属性约简的算法。并采用UCI机器学习中心库中4 个不同的数据集进行实证,实验结果表明,该约简方法可以选择较少的属性而保 持或改善分类能力。 第二种是基于信息量的实值属性约简算法。该方法在已有典型的基于信息量 的属性约简方法的基础上,对其进行拓展。通过构造关于单个属性的相似矩阵, 重新定义属性的信息量、联合信息量、条件信息量以及属性的相对重要性。在算 法实现上,以空集为起点,逐次选择使属性相对重要性最大的属性添加到约简集 中,同时给定一个属性相对重要性的阈值s,作为算法终止的条件。给出多个实 例仿真,验证了该算法的可行性和有效性。 此外,针对更一般的信息系统(不完备实值信息系统),在上述提出的两种 算法基础上,结合容差关系,给出了适用于更广泛的信息系统属性约简方法。 关键词:实值信息系统;Rough集;相似度;区分矩阵:信息量:属性约简 Abstract isoneofthe andfocusesof set Attributereduction importantapplications rough set basedon relation equivalence roughtheory only theory.However,classical in becauseof thediscrete itisrestricted processes data,SO practicalapplications numericalattributeinformation is to existing systems.Therefore,itimportant widely innumerical effectivemethodsofattributereduction attributeinformation explore andis to related systemsnecessarydeveloptheory. statusof set wellasthe

文档评论(0)

1亿VIP精品文档

相关文档