数据挖掘k--eans聚类算法的研究.pdfVIP

下载本文档

16
0
约6.03万字
约 58页
2015-12-23 发布于四川
举报

数据挖掘k--eans聚类算法的研究.pdf

数据挖掘k--eans聚类算法的研究

摘要近年来，全球数据的快速积累以及传播速度不断地提高。人们面对如此海量的数据，处理方式略显落后，因此数据挖掘技术得到了前所未有的迅猛发展。数据挖掘就是从庞大的数据集中发现未知的、有规律性的但又具有价值的过程。聚类分析作为数据挖掘的重要技术之一，其目的在于同一类别相似度尽可能的大，而不同类别相似度尽可能的小。 K一131eans算法是最知名、最常用的聚类算法之一，它是基于划分的算法。该算法在处理均值数据时快速、有效，计算复杂度具有可扩展性等特点。但是必须需要用户事先确定聚类个数，并且常常终止于局部最优致使得不到最佳聚类结果，随机选取初始聚类中心使得聚类结果不稳定，此外对孤立点与噪声非常敏感等缺点。本文首先介绍了数据挖掘的研究背景与意义，然后从聚类的准则函数、数据类型、数据结构和相似度等相关概念介绍了聚类分析，在此基础上全面细致地研究了K-means算法的原理、优点与缺点。针对 K．means算法的缺点提出了两种改进算法：首先从K—means算法需要

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据挖掘k--eans聚类算法的研究.pdfVIP

数据挖掘k--eans聚类算法的研究.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档