- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第26卷 第 12期 重 庆 理 工 大 学 学报 (自然科学) 2012年 12月
V01.26 NO.12 JournalofChongqingUniversityofTechnology(NaturalScience) Dec.2012
doi:10.3969/j.issn.1674—8425(z).2012.12.014
基于属性重要性的Cobweb算法
苟光磊,崔贯勋,王柯柯
(重庆理工大学 计算机科学与工程学院,重庆 400054)
摘 要:从数据样本 自身出发,考察属性的重要性,得到属性的权重,结合定性和定量的角
度分析数据,对概念聚类算法的分类效用进行 了改进。实验证明,与原来概念聚类算法相比,改
进后的聚类正确率得到提高,聚类后的结果也更合理。
关 键 词:概念聚类;属性重要性 ;分类效用;粒度原理
中图分类号:TP311.13 文献标识码:A 文章编号:1674—8425(2012)12—0070—04
An ImprovedCobwebAlgoritlunBasedonAttributeSignificance
GOU Guang—lei,CUIGuan—XUlq,WANG Ke—ke
(SchoolofComputerScienceandEngineering,
ChongqingUniversityofTechnology,Chongqing400054,China)
Abstract:Theimportanceofeveryattributefrom thesamplesetisinspected,andtheweightofevery
attributeisgottoimprovetheefficiencyofclassificationofconceptualclusteringalgorithm,analyzing
datafrom aview ofqualityandquantity.Andtheexperimentresultalsoprovesthattheimprovedalgo—
rithm iSreasonableandeffeetive.
Keywords:conceptualclustering;significanceofattributes;categoryutility;granularanalysis
在机器学习领域中,聚类分析是一种无指导 的属性具有更好的分辨能力,因此在聚类过程中,
的机器学习。概念聚类是一种基于每一个类的特 从属性重要性的高低可以对原问题进行定性分
征描述进行聚类分析的方法,其大多数基于统计 析。粗糙集可以不需要先验知识客观地对各个条
学方法。Cobweb¨是利用分类效用来构建分类树 件属性的重要性进行衡量,并量化这种性质,从而
的概念聚类方法,它假设每个属性是同等重要的, 得到属性的权重,对属性重要性高的属性赋予较
然而,实际中该假设并不总是成立的。 大的权重。本文从信息粒度原理出发,对粗糙集
在信息系统中,由于条件属性所 占的地位不 属性的重要性重新定义,从而更好地保留数据的
一 定相同,所以属性的重要性也不同。重要性高 属性结构。通过对属性权重的衡量来改进Cobweb
收稿 日期:2012—09—15
基金项目:重庆理工大学青年基金资助项 目(2010ZQ22)
作者简介:苟光磊(1980一),男,重庆人,博士研究生,讲师,主要从事数据挖掘、粗糙集研究。
苟光磊,等:基于属性重要性的Cobweb算法 7l
算法中的分类效用,即综合考虑数据的定性分析 G()表示在 中随机选择2个对象。这2个对
(属性重要性)和定量分析
您可能关注的文档
最近下载
- 课件:第五章 自由主义社会福利思想(《现代社会福利思想》课程).pdf VIP
- 第二课 美的本质和特征课件 --中职技校《美育》第四版.pptx VIP
- 二 1~6的表内除法(单元教学设计)苏教版 二年级上册数学2025版.pdf
- 2025春新人教版九年级化学下册《第九单元 溶液》大单元整体教学设计[2022课标].docx
- 美育——美即生活-1.1美的起源和发展-教案.doc VIP
- 教科版科学五年级上册 第一单元《光》大单元教学设计.pdf VIP
- 2025年最新交通局辅警招聘考试题库(附答案).docx VIP
- 全国地图-县级.pptx VIP
- 《规划与自然资源语料库建设导则》.docx VIP
- 幕墙工程幕墙施工专项方案.pdf VIP
文档评论(0)