数据挖掘基础及其应用 课件 第9章 聚类分析Ⅰ概念与K-均值算法.pptx

数据挖掘基础及其应用 课件 第9章 聚类分析Ⅰ概念与K-均值算法.pptx

第9章 聚类分析Ⅰ:概念与K-均值算法; 9.1 引 言;;   问题:聚类与分类的区别是什么?   提示:从目标、数据、模式等方面考虑。   从统计学的观点来看,聚类分析是通过数据建模从而简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用 K-均值、K-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。;   聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析由所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类结果未必一致。   从实际应用的角度来看,聚类分析是数据挖掘的主要任务之一。   分类与聚类的区分归纳为如下几点,如表9-1所示。;;   基于上述分析,给定聚类分析定义如下:   聚类依据研究对象(样品或指标)的特征对其进行分类,从而减少研究对象的数目。由于很多事物缺乏可靠的历史资料,无法确定共有多少类别,而聚类的目的是将性质相近的事物/对象归入一个组/簇。   定义9.1(聚 类 分 析 ClusteringAnalysis) 将 一 组 研 究 对 象 分 为 相 对 同 质 的 群 组(Clusters)的统计分析技术。;   聚类分析已经

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档