基于层次迭代思想的聚类算法的研究.pdfVIP

基于层次迭代思想的聚类算法的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次迭代思想的聚类算法的研究.pdf

第 24 卷第 3 期 2011 年 05 月 唐山学院学报 Vol. 24 No.3 May.2011 Journal of Tangshan College 基于层次迭代思想的聚类算法的研究 彭宏玉1 ,柴旭光2 ,陈晓纪2 (1.唐山学院计算机系,河北唐山 063000 , 2. 邢台职业技术学院信息工程系,洞北邢台 054000) 摘要:聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方 法。通过基于迭代思想的聚类算法,可对给定的数据对象集合进行层次分解,最终将样本空间分类 成有聚类集合。 关键词:数据挖掘$聚类分析 s层次算法 中图分类号: TP301. 6 文献标识码 :A 文章编号 :1672 一 349X(2011)03 - 0086 - 02 The Clustering Algorithm of Level Lterated Theory PENG Hong-yu 1 ,CHAI Xu-guang 2 ,CHEN Xiao-W (1. Tangshan College , Tangshan 063000 , China , 2. Xingtai Polytechnic College , Xingtai 054000 ,China) Abstract: Cluster analysis is a major research field in data mining which also is an important means and method of data partitioning or grouping. Cluster algorithm can conduct the hierarchi- cal decomposition of given data sets and finally classify the sample spatial assortments into cluste- rmg sets. Key Woros: data mining; cluster analysis; hierarchical algorithm 。 引言 聚类是数据挖掘中的一种重要技术,是分析数据并从中 发现有用信息的一种有效手段。通过聚类,人们能够识别密 集和稀疏的区域,发现全局的分布模式以及数据属性之间有 趣的相互关系.聚类分析在客户分类、基因识另IJ 、 www 文 本分类、空间数据处理、卫星照片分析、医疗图像自动检测等 领域有着广泛的应用川,而其本身的研究也是一个蓬勃发展 的领域,数据挖掘、统计学、机器学习、空间数据库技术、生物 学和市场学的发展推动着聚类分析研究的进展,使它已成为 数据挖掘研究中的一个热点.与其他数据挖掘方法不同,在 进行聚类分析前用户一般并不知道数据集的特征。因此,从 某种角度看,聚类分析是一种元监督的学习过程,是基于观 察的学习而不是基于实例的学习.通常的聚类分析算法可 分为划分方法、层次方法、基于密度的方法I叫. (1)划分方法 (partitioning method) 给定一个 n 个对象或元组的数据库,一个划分方法构建 数据的 K 个划分,每个划分表示一个聚类,并且 K=n. 也就是说,它将数据划分为 K 个组,同时满足如下要求 z 每 个组至少包含一个对象$每个对象必须属于且只属于一个 组,同时某些模糊划分技术中第二个要求可以放宽. lIt稿日期 :2011-03-29 (2)层次方法(hierarchical method) 层次的方法对给定的数据对象集合进行层次的分解. 根据层次的分解如何形成,层次的方法可以分为凝聚的和分 裂的。凝聚的方法,也称为自底向上的方法,一开始将每个 对象作为单独的一个组,然后相继地合并相近的对象或组, 直到所有的组合并为一个(层次的最上层) ,或者达到一个终 止条件。分裂的方法,也称为自顶向下的方法,一开始将所 有的对象置于一个聚类中.在迭代的每一步中,一个类被分 裂为更小的类,直到最终每个对象在单独的一个类中,或者 达到一个终止条件。 (3)基于密度的方法(densit沪based method 绝大多数划分方法基于对象之间的距离进行聚类。这样 的方法只能发现球状的类,而在发现任意形状的类上遇到了 困难。随之提出了基于密度的另一类聚类方法,其主要思想 是 g只要临近区域的密度(对象或数据点的数目)超过某个阔 值,就继续聚类.也就是说,对给定类中的每个数据点,在一 个给定的范围的区域中必须至少包含某个数目的点.这样的 方法可以用来过滤噪声孤立点数据,发现任意形状的聚类[S]. 本文通过分析研究以上算法,提出了基于层次迭代思想 的聚类算法. 作者简介:~宏玉0977-) ,

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档