一种基于模糊聚类的区间值属性约简算法.pdfVIP

  • 15
  • 0
  • 约1.08万字
  • 约 5页
  • 2017-09-14 发布于湖北
  • 举报

一种基于模糊聚类的区间值属性约简算法.pdf

第27卷第1期 模糊系统与数学 V01.27,No.1 andMathematics 2013年2月 FuzzySystems Feb.,2013 文章编号:1001—7402(2013)01—0149—05 一种基于模糊聚类的区间值属性约简算法+ 郭 庆1,刘文军2,焦贤发1,吴磊1 (1.合肥工业大学数学学院,安徽合肥230009; 2.长沙理工大学数学与计算科学学院,湖南长沙410076) 摘要:针对区间值信息系统基于粗糙集理论提出一种新的属性约简算法:首先计算同一属性下对象间 的相似度,然后通过舍取算子计算出所有属性下对象之间的相似度矩阵,再用模糊聚类中的传递闭包算 子得到等价矩阵,将区间值信息系统转化为具有等价关系的信息系统并且进行约简,从而得到A一核,同 时给出了该算法的复杂度。最后通过一个实例表明这种算法的有效性和合理性。 关键词:区间值信息系统;模糊聚类;模糊等价关系;传递闭包;可区分矩阵 中图分类号:TPl8 文献标识码:A 粗糙集理论是由波兰华沙理工大学Pawlak教授于20世纪80年代初提出的一种研究不完整、不确 定知识和数据的表达、学习、归纳的理论方法[1]。粗糙集方法研究包含多值属性的对象集合,用上近似 集和下近似集对应确定属于给定类的最大的对象集合和可能属于给定类的最小的对象集合。由于粗糙 集方法无需提供除数据外的任何先验知识,而且得到的知识是以规则的形式描述的,容易被人理解和 应用,近年来关于信息系统属性值的不确定性的属性约简问题受到研究者的广泛关注,并被研究者从 多方面进行推广。经典的粗糙集理论是以等价关系为数学基础的,所处理的对象属性为离散值或者是 不完备的信息系统。而在现实生活中,连续属性值甚至区间值信息系统是普遍存在的。近些年关于区间 值值信息系统的属性约简得到大量研究[2_8]。模糊聚类技术已被广泛的应用到数据处理中。本文针对区 间值信息系统的属性约简,结合模糊聚类算法提出一种新的属性约简算法。该算法首先定义属性值之间 的相似度,建立各个属性下的相似度矩阵;其次采用矩阵合取的方式给出属性集的相似度矩阵;然后利 用模糊聚类技术将其进行闭包运算得到等价矩阵;在给定以主观水平下对属性值进行聚类,基于粗糙集 理论对信息系统进行属性约简。最后通过一个实例表明该算法的有效性与合理性。 1 预备知识 —U 口∈A V A,定义B上的不可分辨关系为ind(B)一{(甜i,“,)∈U×U IYn 集X及U上的不可分辨关系R,分别称集合砝一U{y∈U/RIY∈X}与积一U(y∈U/R ÷收稿日期:2011—09—12;修订日期:2011—11-29 基金项目:国家自然科学基金资助项目 作者简介:郭庆(1979一),男,安徽霍邱人,合肥工业大学数学学院讲师,研究方向:模糊数学与粗糙集理论I刘文军(1971一),男,湖 南邵东人,长沙理工大学数学与计算科学学院副教授,研究方向:模糊数学,粗糙集理论与数据挖掘;焦贤发(1965一),男,安徽安庆人,合 肥工业大学教授,研究方向:应用数学与控制理论。 万方数据 150 模糊系统与数学 RX x≠⑦)为x的R下近似集和上近似集,称d。(x)一l1/I积l为信息系统的R精度,称rR(X)一 1一d。(X)为粗糙度。若A—CUD,其中D为决策属性,称该数据表为决策表,C和D分别称为条件 属性集和决策属性集。 定义1.2[91设T一(u,A,y,厂)表示一个决策表信息系统,其中u为论域,A—CUD,Va∈C

文档评论(0)

1亿VIP精品文档

相关文档