- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第32卷第5期 长春师范学院学报(自然科学版) 2013年10月
V01.32No.5 3
Joumalof Normal 0et.201
ChangchunUniversity(NaturalScience)
一种基于二分法和属性加权平均重要度的约简算法
崔广才1,王春才1,李英韬2,李哲2
(1.长春理工大学计算机科学技术学院,吉林长春130022;
2.长春市万易科技有限公司工程研究中心,吉林长春130003)
[摘要]属性约简是粗糙集理论中的一个重要环节。属性约简能在保持信息系统分类能力不变
的基础上,删除冗余属性信息,提高系统的决策效率。本文结合几种常见的属性约简算法的特点,
提出了一种基于二分法和属性加权平均重要度的约简算法。
[关键词]数据挖掘;粗糙集;属性约简
【中图分类号]TP301[文献标识码]A [文章编号】1008—178X(2013)05—0013—04
属性约简就是在保持信息系统分类能力不变的基础上,删除冗余属性信息,提高信息系统决策效率,因此
属性约简算法在数据处理过程中有很重要的地位。通常,从约简操作的角度可将约简算法分为向前递增法、
向后递减法及双向选择的属性约简算法。对传统属性约简算法的改进和新算法的研究主要包括启发式算法
研究和与智能算法结合的研究,如与遗传算法、神经网络等相结合。启发式算法采用逐项增减属性的方法尝
试求解约简,智能算法搜索解时需多次迭代,时间消耗较大。本文给出基于二分法和属性加权平均重要度的
约简改进算法,以有效降低算法时间复杂度。
1相关概念
1.1属性重要度
在粗糙集理论中,属性的重要度通过条件属性相对于决策属性的相对正域的形式使之量化。
u
定义l 给定决策表K=(U,CD,V,f),V∥∈C,定义
1
SIG(B,C.D):r(D)-。(D)-竺坐婴掣.rc ()
(p,;D)=(D)一邶}(D)=二—L__斋—旦L一.
为条件属性B对条件属性集C相对于决策属性D的重要度。
1.2基于信息熵的属性重要度
性B∈C—B,当把p加入到属性集B后互信息的增量
{B})),将此增量△I定义为基于信息熵的属性重要度,用SCG(p,B;D)表示,即
SCG(B,B;D)=H(DIB)一H(DlBu{p})). (2)
其中SCG(B,B;D)越大,表示B对D的重要程度越高。
1.3基于属性加权平均重要度
uD,V,f),V
定义3属性加权平均重要度:给定决策表K=(u,c B∈C,属性B∈C—B,p的加权平均重
[收稿日期]2013—07—04
[基金项目]吉林省教育厅科研计划项目。
[作者简介]崔广才(1964一),男,吉林长春人,长春理工大学计算机科学技术学院教授,博士生导师,从事遗传算法研究。
·13·
万方数据
要度为
WMAS(B,B;D)=仅×SIG(B,B;D)+(1一仅)XSCG(p.,B;D), (3)
的取值更趋于合理。
2基于属性加权平均重要度的约简算法
粗糙集理论的基本思想认为知识是具有颗粒性的,基于属性重要度的约简算法以知识的颗粒性为基础,
量化决策属性对各个条件属性的依赖程度的变化,重点计算包含在正域或相对正域中的元素,却忽视了负域
和边界
文档评论(0)