基于层次的聚类法的研究与实现.doc

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于层次的聚类法的研究与实现

独创性声明 本人郑重声明:所呈交的是本人在的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。签名: 日期:年月日 保密的学位论文在解密后应遵守此协议 论文题目: 学生签名: 日期 年 月 日 导师签名: 日期 年 月 日 基于层次的聚类算法的研究与实现 摘 要 聚类分析是数据挖掘中的一个重要领域,是数据划分或分组处理的重要手段和方法,聚类分析已经应该于广泛的领域。聚类算法可以分为基于层次的方法、基于划分的方法、基于网格的方法、基于密度的方法和基于模型的方法。 层次聚类算法因为算法思想简单,适合于大量数据的聚类,所以是实际应用中聚类分析的支柱。本文重点对层次聚类算法进行了分析和研究,阐述了基于层次聚类的CURE和BIRCH算法,并实现了这两种算法以及给出了它们的聚类结果。 CURE算法是利用代表点聚类,它解决了偏好球形和相似大小的问题,可以发现具有任意大小和形状的聚类,而且在处理孤立点上也更加健壮。BIRCH是用聚类中心和半径来代表聚类,具有一定的处理噪音的能力,而且它是一种增量聚类方法,它不要求所有数据一次性读入内存,所以空间复杂度低,但是BIRCH算法无法发现任意形状和大小的聚类。 关键词:聚类分析;层次聚类;CURE;BRICH Research and Implementation of the algorithm based on hierarchical clustering Sun Xili College of Information Science and Engineering, Jishou University, Jishou,Hunan 416000 Abstract: Clustering analysis is an essential field in data mining and also important means and method of data classification or grouping processing. Cluster analysis has played an important role in a wide range of data partitioning areas. Clustering algorithms can be divided into the method based on hierarchy, the methods based on the partition ,the grid-based methods, the density-based method and the model-based method. Hierarchical clustering algorithm is a mainstay of the clustering analysis in practical application for its simple algorithm ideas, and suitable for large amounts of data clustering .This paper focuses on the hierarchical clustering algorithm analysis and research,expounds CURE and BIRCH algorithm based on hierarchy clustering algorithm,and implements the two algorithms and their clustering results are given. CURE?algorithm?is?the?use?of?the?clustering?of?the?representative?point,itsolved?the?problem?of?the??preference?of?spherical?and?similar?size,?clusteringcan?be?found?with any?size?and?shape,?but?also more robust in dealing with the?isolated?point.BIRCH?is?using?the?clustering?center?and?radius?to delegate clustering,also?with?the?ability?to?handling

文档评论(0)

xpb395 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档