结合粗集数据分析方法及其应用研究.pdf

81 Y19751 摘要 上世纪80年代,Z.Pawlak提出了粗集这一不确定数据分析方法,进一步补 充了概率论、证据理论、模糊集理论等不确定数据分析理论。经历近30年的发 展,粗集模型已被广泛应用于许多领域。它的优点在于其能够评估数据之间的依 赖关系,而无需任何的先验信息。目前,粗集理论已成为智能信息处理领域的重 要数学工具之一。大量已发表的文献表明,数据约简与规则发现是粗集理论及应 用研究中的重要内容。利用数据约简删除不相关或冗余数据有时会有助于数据分 析效率的提高。近年来,随着粗集理论与应用研究的深入,结合粗集的多方法融 合研究也逐渐引起了人们的重视。 本文首先概述了粗集理论的背景以及粗集的理论基础。选择了数据分析中的 连续属性的离散化、多属性决策中的权重确定以及支持向量机回归预测问题,在 借鉴前人研究经验的基础上,将粗集理论方法结合运用于上述问题,主要完成以 下工作: (1)分析了SOM神经网络聚类算法的流程。将自组织特征映射神经网络 (SOM)与粗糙集理论中决策表不相容度的反馈信息结合,应用于信息系统或 决策表中连续属性的离散化。给出一种基于动态SOM聚类的连续属性离散化方 法。该算法不仅可以处理一致决策表还可以处理不一致决策表。数据实验表明: 与其他已有的几种连续属性离散化方法相比,本文提出的方法具有一定的优点。 (2)结合王国胤等提出的粗糙集模糊度的基础上,给出一种属性权重的定 义。将其与TOPSIS方法融合,提出融合粗集属性约简和模糊度赋权的TOPSIS 方法,并推广到多属性群决策方法中。算例说明了该方法的简便易行,有一定的 应用价值。 (3)将粗糙集理论与SVM融合,研究了结合粗糙集属性约简的支持向量 回归机(RSSVR)在我国电力供应量回归分析和预测中的性能。实例研究表明: 将粗糙集预处理作为SVR的前置模块,对原始数据有一定的精简作用,提取了 部分主要属性,在一定程度上提高了SVR的预测精度。 关键词:粗糙集;离散化;属性约简;模糊度:支持向量机 Abstract set Z.Pawlakthe 1 a Rough new theory,proposedby during 980s,is early to and further approachhandlingimperfectdata(uncertaintyvagueness).It other thatdeal theories withdata aS complements uncertainty,such probabilitytheory, ofevidence set theory 30 Dempster-Shafer theory,fuzzytheory,etc.After nearly of setmodelhas

文档评论(0)

1亿VIP精品文档

相关文档