基于属性重要性的Cobweb算法.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第26卷 第 12期 重 庆 理 工 大 学 学报 (自然科学) 2012年 12月 V01.26 NO.12 JournalofChongqingUniversityofTechnology(NaturalScience) Dec.2012 doi:10.3969/j.issn.1674—8425(z).2012.12.014 基于属性重要性的Cobweb算法 苟光磊,崔贯勋,王柯柯 (重庆理工大学 计算机科学与工程学院,重庆 400054) 摘 要:从数据样本 自身出发,考察属性的重要性,得到属性的权重,结合定性和定量的角 度分析数据,对概念聚类算法的分类效用进行 了改进。实验证明,与原来概念聚类算法相比,改 进后的聚类正确率得到提高,聚类后的结果也更合理。 关 键 词:概念聚类;属性重要性 ;分类效用;粒度原理 中图分类号:TP311.13 文献标识码:A 文章编号:1674—8425(2012)12—0070—04 An ImprovedCobwebAlgoritlunBasedonAttributeSignificance GOU Guang—lei,CUIGuan—XUlq,WANG Ke—ke (SchoolofComputerScienceandEngineering, ChongqingUniversityofTechnology,Chongqing400054,China) Abstract:Theimportanceofeveryattributefrom thesamplesetisinspected,andtheweightofevery attributeisgottoimprovetheefficiencyofclassificationofconceptualclusteringalgorithm,analyzing datafrom aview ofqualityandquantity.Andtheexperimentresultalsoprovesthattheimprovedalgo— rithm iSreasonableandeffeetive. Keywords:conceptualclustering;significanceofattributes;categoryutility;granularanalysis 在机器学习领域中,聚类分析是一种无指导 的属性具有更好的分辨能力,因此在聚类过程中, 的机器学习。概念聚类是一种基于每一个类的特 从属性重要性的高低可以对原问题进行定性分 征描述进行聚类分析的方法,其大多数基于统计 析。粗糙集可以不需要先验知识客观地对各个条 学方法。Cobweb¨是利用分类效用来构建分类树 件属性的重要性进行衡量,并量化这种性质,从而 的概念聚类方法,它假设每个属性是同等重要的, 得到属性的权重,对属性重要性高的属性赋予较 然而,实际中该假设并不总是成立的。 大的权重。本文从信息粒度原理出发,对粗糙集 在信息系统中,由于条件属性所 占的地位不 属性的重要性重新定义,从而更好地保留数据的 一 定相同,所以属性的重要性也不同。重要性高 属性结构。通过对属性权重的衡量来改进Cobweb 收稿 日期:2012—09—15 基金项目:重庆理工大学青年基金资助项 目(2010ZQ22) 作者简介:苟光磊(1980一),男,重庆人,博士研究生,讲师,主要从事数据挖掘、粗糙集研究。 苟光磊,等:基于属性重要性的Cobweb算法 7l 算法中的分类效用,即综合考虑数据的定性分析 G()表示在 中随机选择2个对象。这2个对 (属性重要性)和定量分析

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档