基于密度方法的聚类.pptVIP

下载本文档

32
0
约7.91千字
约 65页
2019-01-02 发布于湖北
举报

基于密度方法的聚类.ppt

聚类分析宋宜飞主要内容回顾密度聚类方法 DBSCAN算法 OPTICS 算法网格聚类方法 CLIQUE算法回顾聚类聚类(clustering)也称为聚类分析,指将样本分到不同的组中使得同一组中的样本差异尽可能的小，而不同组中的样本差异尽可能的大。聚类得到的不同的组称为簇(cluster)。一个好的聚类方法将产生以下的聚类最大化类中的相似性最小化类间的相似性回顾聚类的分类：划分聚类方法层次聚类方法密度聚类方法网格聚类方法模型聚类方法 k-means 算法 k-means 算法基本步骤从 n个数据对象任意选择 k 个对象作为初始聚类中心；根据每个聚类对象的均值(中心对象)，计算每个对象与这些中心对象的距离；并根据最小距离重新对相应对象进行划分；重新计算每个(有变化)聚类的均值(中心对象)；　　计算标准测度函数，当满足一定条件，如函数收敛时，则算法终止；如果条件不满足则回到步骤2。 k-means优缺点主要优点：是解决聚类问题的一种经典算法，简单、快速。对处理大数据集，该算法是相对可伸缩和高效率的。当结果簇是密集的，它的效果较好。主要缺点在簇的平均值被定义的情况下才能使用。必须事先给出k（要生成的簇的数目），而且对初值敏感，对于不同的初始值

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于密度方法的聚类.pptVIP