数据挖掘-p09-聚类.pptVIP

下载本文档

24
0
约4.66千字
约 53页
2018-01-21 发布于河北
举报

数据挖掘-p09-聚类.ppt

数据挖掘-p09-聚类

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 第9章聚类分析 9.1 聚类概述 9.2 聚类分析中的相似度计算 9.3 基于划分的聚类方法 9.4 基于层次的聚类算法 9.5 谱聚类方法 9.6 利用SQL Server 2005进行聚类分析 * 聚类结果应满足条件给定一个n 个对象或元组的数据源，划分方法将数据构建k 个划分，每个划分表示一个聚簇，并且 k≤n，同时满足如下要求：（1）每个组至少包含一个对象（2）每个对象必须属于一个组 * 划分聚类方法聚类时的要点：划分聚类方法聚类时的要点：选定某种距离作为数据样本间的相似性度量选择评价聚类性能的准则函数选择某个初始分类，之后用迭代的方法得到聚类结果，使得评价聚类的准则函数取得最优值 * 9.3.1 k-平均聚类算法基本思想：将各个聚类子集内的所有数据样本的均值作为该聚类的代表点通过迭代过程把数据集划分为不同的类别，使得评价聚类性能的准则函数达到最优，从而使生成的每个聚类类内紧凑，类间独立 * k-平均聚类算法描述 * 9.3.2 k-中心点算法基本思想：选择簇中最接近簇中心的对象作为簇的代表点通过迭代过程把数据集划分为不同的类别，同时不断调整簇的代表点，以改进进行聚类的质量 * k-中心点算法描

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据挖掘-p09-聚类.pptVIP