- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于邻域粗糙集和蚁群优化的属性约简算法
第 32卷第 5期 河 北 科 技 大 学 学 报 Vo1.32,No.5
2011年 1O月 JournalofHebeiUniversityofScienceandTechnology 0ct.20l1
文章编号 :1008—1542(2011)05~0403—06
基于邻域粗糙集和蚁群优化的属性约简算法
张冬雯 ,王 鹏 ,仇计清
(1.河北科技大学理学院,河北石家庄 050018;2.河北科技大学信息科学与工程学院,河北石家庄
050018)
摘 要 :在分析单一、给定的邻域大小设定方法弊端的基础上,提 出了基于属性数据标准差的阈值
设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造 了基于邻域粗糙
集和蚁群优化的属性约简算法,使用 了4个 UCI数据集进行约简。实验结果表 明,提 出的算法在
约简的分类精度和约简中属性个数方面具有更好的性能。
关键词 :邻域粗糙集;蚁群优化 ;属性约简;标准差
中图分类号:O231 文献标志码:A
Approach tOfeatureselectionbasedonneighborhoodrough
setandantcolonyoptimization
ZHANGDong—wen ,WANGPeng ,QIUJi—qing
(1.CollegeofSciences,HebeiUniversityofScienceandTechnology,ShijiazhuangHebei050018,China;2.CollegeofInforma—
tionScienceandEngineering,HebeiUniversityofScienceandTechnology,ShijiazhuangHebei050018,China)
Abstract:Thispaperanalysestheweaknessofsettingasingle,specifiedthresholdforthesizeofneighborhood,andthenputs
forwardanew neighborhoodsettingmethodbasedonthestandarddeviationoffeaturedata.Thepaperintroducesantcolong
opbimization (ACO)intofeatureselectionandproposesanapprovedfeatureselectionalgorithm basedon NRS andACO,in
whichthefeatureimportanceistakenastheheuristicinformation.InordertOevaluatetheperformanceoftheproposedalgo—
rithm ,fourdatasetsfrom UCIareusedandtheexperimentalresultsshow thattheproposedalgorithm hasabetterperformance
inclassificationaccuracyofreduetandfeaturenumberinreduct.
Keywords:neighborhoodroughset;antcolonyoptimization;featureselection;standarddeviation
属性约简的 目的是在不降低预测分类精度的前提下对数据的属性集合进行约简,摒弃冗余的属性,从而
降低对数据处理时的时间和空间复杂度[1]。所有的属性约简算法都包括 2个重要的部分:评价函数和子集
生成器。评价函数是对属性子集 的分辨能力的一种量度 ,它能够对属性子集的预测分类精度进行评估 ;子集
生成器是使用评价函数对属性集合进行约简,得到最优属性子集的过程。作为一个重要的粒度计算工具,粗
糙集理论(RST)_l2被广泛应用于属性约简的算法 中[a-sJ。然而,粗糙集理论使用等价关系和等价类的概念对
整个论域进行划分,这只适用于处理离散型属性的数据。对于现实应用中的大量数据 ,往往同时存在离散型
和连续型 2种属性
原创力文档


文档评论(0)