基于相对优势类差量的序信息系统属性约简算法.pdfVIP

  • 7
  • 0
  • 约1.51万字
  • 约 7页
  • 2017-09-14 发布于湖北
  • 举报

基于相对优势类差量的序信息系统属性约简算法.pdf

第27卷第1期 模糊系统与数学 V01.27,No.1 andMathematics Feb.,2013 2013年2月 FuzzySystems 文章编号:l001—7402(2013)01—0142—07 基于相对优势类差量的序信息系统属性约简算法+ 吕跃进1,韦碧鹏1’2,胡明明1 (1.广西大学,数学与信息科学学院,广西南宁530004; 2.柳州职业技术学院公共基础部,广西柳州545006) 摘 要:针对序信息系统。定义了优势类差量和相对优势类差量,讨论了一种刻画属性重要度的新指标。 在此基础上,提出一种基于相对优势类差量的启发式约简算法,它能从搜索空间中删除不重要属性,降 低了约简的时间复杂度。与现有启发式约简算法相比。该算法具有较高的搜索效率。实例与实验表明了 该算法的可行性与有效性。 关键词:粗糙集理论;序信息系统;优势类差量;相对优势类差量;属性约简 中圈分类号:0159;TPl8文献标识码:A 1 引言 波兰数学家Pawlak于1982年提出了粗糙集理论[1],它是一种处理模糊、不精确性以及不确定性的 数学工具。其主要是以完备的信息系统为依据,以等价关系为基础的一种理论。近年来,由于它具有的 优势,已经被成功地运用到数据挖掘、模式识别、决策分析等等领域。属性约简是粗糙集理论中的核心问 题口],它是在保持知识库的分类能力不变的前提下删除不相关或者不必要的属性。针对经典的信息系 统,从搜索空间中逐步删除不重要属性,与此同时依次添加最重要的属性的启发式约简算法在文献[2] 中已被提出,实验表明在启发式算法中融入这种逐步剔除不重要属性的策略是有意义的。文献[3]借鉴 这种思想提出了决策系统属性约简的双向算法;文献[4]又将此思想应用到概念格的约简中,提出了概 念格属性约简的改进算法。 在现实问题中,信息系统的属性值域还有可能是连续或者具有偏序关系的。经典粗糙集在处理属性 值域具有连续性的信息系统时需要将属性值离散化,但是这样会导致部分的信息丢失;对于属性值域具 有偏序关系的情形,经典粗糙集模型无能为力。基于此,Greco等Cs-6]提出了基于优势关系的粗糙集模 型,即序信息系统。基于序信息系统的属性约简算法,国内外已经开始进行研究‘7叫1‘,然而这些约简算 法的时间复杂度和搜索效率都不太理想。本文通过定义了优势类差量和相对优势类差量,给出了一种属 性重要性度量的新指标。根据文献[2]提出的启发式约简算法思想,提出了一种基于相对优势类差量的 3 启发式约简算法,该算法的时间复杂度为o(IAII【,J2)。最后实验说明该算法的搜索效率相对于文献 [11]约简算法的搜索效率要高得多。 ·收稿日期:2011—06—24;修订日期:2011—08—24 基金项目:广西自然科学基金资助项目(桂科自0991027) ..堡童简介:吕匦避!j158一’:男,熬擐,研雍方向:不确定决策,数据挖掘;韦碧鹏(1987一),男,研究生,研究方向:粗糙集理论及其应 用,胡明明(1986一),男。研究生,研究方向:不确定决策。 万方数据 第1期 吕跃进,韦碧鹏等:基于相对优势类差量的序信息系统属性约简算法 143 2 序信息系统的基本概念 定义2.1[】2] 称((,,A,厂)是一个信息系统,其中【厂为对象集合,即U={z。,z。,…,z。},而A为属 性集合,即A={口。,口。,…口。),,为U和A的关系函数,即,:U×A—y,V—Un(口E以),V是属性 集域的集合,y。为对象在属性口下的值域。对于BEA,称R言为信息系统下的优势关系,即尺言一{(z,, 五)∈U×U I无(z,)≥尤(五),V a

文档评论(0)

1亿VIP精品文档

相关文档