数据挖掘论文19766new.docVIP

  • 6
  • 0
  • 约5.8千字
  • 约 5页
  • 2016-11-22 发布于江西
  • 举报
数据挖掘论文19766new.doc

聚类分析模式中K均值算法的综述及改进分析 班级:09信息与计算科学 学号:20090810010218 姓名:周小员 摘要:聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类分析已被广泛应用于统计学、机器学习、空间数据库、生物学以及市场营销等领域。聚类算法可以分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。本文主要介绍了聚类分析模式中几种算法,由于在这些方法当中,K-means(k—均值)算法是一种应用十分广泛的聚类分析方法,所以本文同时叙述了经典的K-means算法,并总结了一些针对K-means算法的相关改进。 关键字 : 聚类分析 K-means算法 1.引言 随着计算机技术的发展,信息数据越来越多,如何从海量数据中提取对人们有价值的信息已经成为一个非常迫切的问题。由此产生了数据挖掘技术,它是一门新兴的交叉学科,汇集了来自机器学习、模式识别、数据库、统计学、人工智能等各领域的研究成果。聚类分析是数据挖掘中的一个重要研究领域。它在图像处理、入侵检测和生物信息学等方面有着极为重要的应用。数据挖掘是从大量数据中提取出可信、 新颖、 有效并能被人理解的模式的高级处理过程。 其目标是从数据库中发现隐含的、 有意义的知识。聚类分析作为一个独立的工具来获得数据分布的情况,是数据挖掘的一个重要研究分支。

文档评论(0)

1亿VIP精品文档

相关文档