基于全局正区域不一致性的快速求核算法-SitesPSU.PDF

基于全局正区域不一致性的快速求核算法-SitesPSU.PDF

第42卷 第8期 计 算 机 科 学 Vo1.42No.8 2015年 8月 Computer Science AUl12015 基于全局正区域不一致性的快速求核算法 赵 洁 梁俊杰。 董振宁 陈 旭 唐德育 (广东工业大学 广州 510520) (华南理工大学 广州510006)。 摘 要 首先基于改进的Hash和位运算设计了快速等价类与正区域算法,将其作为求核基础;然后设计基于全局正 区域不一致性的快速求核算法。区别于现有算法在求核过程中需要反复多次求正区域,深入分析 了核属性 ai的特 征,捕捉两类 C一 {a}所形成的正区域与全局正区域 的不一致 ,不需要反复求完整 的C一(a)正区域 ,通过 3个定理证 明了基于全局正区域不一致性识别核属性的正确性和有效性。使用UCI中21个数据集、超高维和海量数据集进行 全面检验 ,结果表明无论是多/少实体、多/少属性和有/无核的决策表,本算法在大部分情况下都优于现有 同类算法, 尤其适用于大型决策表 。 关键词 粗糙集 ,核属性,全局正区域 ,不一致性 中图法分类号 TP311 文献标识码 A DOI 10.11896/j.issn.1002—137)(.2015.8.053 GlobalPositiveRegionInconsistencyBasedAttributesCoreComputation ZHAOJie LIANGJu叫ie DONGZhen-ning CHENXu TANGDe-yu (GuangdongUniversityofTechnology,Guangzhou510520,China) (SouthChinaUniversityofTechnology,Guangzhou510006,China) Abstract Thispaperfirstlyproposedbasicalgorithmsofpositiveregionandequivalenceclassbasedonbitvectorand improvedHashalgorithm.Thenthecoreattributescomputationalgorithm wasdesignedbasedonglobalpositiveregion inconsistency.Differentfrom currentalgorithmswhichneedtocomputecompletepositiveregionsrepeatedlywhensee— kingattributescore,thispaperstudiedthecharacteristicsofcoreattributes,andcaughttheinconsistenciesbetweenthe positiveregionofC一 {a}andtheglobalpositiveregion.ThecompletepositiveregionsofC一 {ai}don’tneedtobe computedrepeatedly.Globalpositiveregioninconsistencybasedattributescorerecognitionwasprovedby3theories.21 datasetsofUCIultra-high-dimensionaldatasetsandmassivedatasetswereusedtotestthealgorithmsproposedby thispaper.Andtheresultsshow theattributescorecomputationalgorithm ofthispaperownsgoodperformanceno matterwhenthenumberofentitiesandattributesismoreorlessand especiallyissuitableforprocessinglargedecision table. Keywords

文档评论(0)

1亿VIP精品文档

相关文档