基于划分聚类法的文献综述概要.ppt

基于划分聚类法的文献综述概要

基于划分聚类法的文献综述 引言 算法 应用 总结 引言 聚类分析是一种重要的无监督学习方法,作为数据分析的工具,其重要性在各个领域都得到了广泛的认可。 目的:是寻找数据集中的“自然分组”,即所谓“簇”。 通俗地讲, 簇是指相似元素的集合,聚类分析就是一个在数据集中寻找相似元素集合的无监督学习过程。 分类:聚类分析的方法可分为基于层次的聚类方法、基于划分的聚类方法、基于模型的聚类方法、基于密度和网格的聚类方法等。本文将介绍基于划分的聚类方法。 本课题简单地阐述了经典 K-modes与快速全局K-means聚类算法的基本思想及算法流程。 k-modes算法采用差异度来代替k-means算法中的距离。k-modes算法中差异度越小,则表示距离越小。一个样本和一个聚类中心的差异度就是它们各个属性不相同的个数,不相同则记为一,最后计算一的总和。这个和就是某个样本到某个聚类中心的差异度。该样本属于差异度最小的聚类中心。 算法 算法 k-means 算法的工作过程说明如下: 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。 缺点:k-mea

文档评论(0)

1亿VIP精品文档

相关文档