5聚类分析资料.ppt

5聚类分析资料.ppt

第五章 聚类分析(提纲) 5.1 聚类分析概述 5.2 相似性计算方法 5.3 常用聚类方法 5.3.1 划分方法 k-means算法(k-均值算法) k-medoids算法(k-中心算法) 5.3.2 层次方法 AGNES算法(合并聚类法) DIANA算法(分裂聚类法) 5.4 孤立点分析 第五章 聚类分析(提纲) 5.1 聚类分析概述 5.2 相似性计算方法 5.3 常用聚类方法 5.3.1 划分方法 k-means算法(k-均值算法) k-medoids算法(k-中心算法) 5.3.2 层次方法 AGNES算法(合并聚类法) DIANA算法(分裂聚类法) 5.4 孤立点分析 5.1 聚类分析概述 聚类分析的定义 聚类分析(Cluster Analysis)是一个将数据集中的所有数据,按照相似性划分为多个类别(Cluster, 簇)的过程; 簇是相似数据的集合。 聚类分析是一种无监督(Unsupervised Learning)分类方法:数据集中的数据没有预定义的类别标号(无训练集和训练的过程)。 要求:聚类分析之后,应尽可能保证类别相同的数据之间具有较高的相似性,而类别不同的数据之间具有较低的相似性。 5.1 聚类分析概述 聚类分析在数据挖掘中的作用: 作为一个独立的工具来获得数据集中数据的分布情况; 作为其他数据挖掘算法的预处理步骤。 5.1 聚类分析概述 聚类分析在数据挖

文档评论(0)

1亿VIP精品文档

相关文档