基于密度方法的聚类.pptVIP

  • 32
  • 0
  • 约7.91千字
  • 约 65页
  • 2019-01-02 发布于湖北
  • 举报
聚 类 分 析 宋宜飞 主要内容 回顾 密度聚类方法 DBSCAN算法 OPTICS 算法 网格聚类方法 CLIQUE算法 回顾 聚类 聚类(clustering)也称为聚类分析,指将样本分到不同的组中使得同一组中的样本差异尽可能的小,而不同组中的样本差异尽可能的大。 聚类得到的不同的组称为簇(cluster)。 一个好的聚类方法将产生以下的聚类 最大化类中的相似性 最小化类间的相似性 回顾 聚类的分类: 划分聚类方法 层次聚类方法 密度聚类方法 网格聚类方法 模型聚类方法 k-means 算法 k-means 算法基本步骤 从 n个数据对象任意选择 k 个对象作为初始聚类中心; 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分; 重新计算每个(有变化)聚类的均值(中心对象);    计算标准测度函数,当满足一定条件,如函数收敛时,则算法终止;如果条件不满足则回到步骤2。 k-means优缺点 主要优点: 是解决聚类问题的一种经典算法,简单、快速。 对处理大数据集,该算法是相对可伸缩和高效率的。 当结果簇是密集的,它的效果较好。 主要缺点 在簇的平均值被定义的情况下才能使用。 必须事先给出k(要生成的簇的数目),而且对初值敏感,对于不同的初始值

文档评论(0)

1亿VIP精品文档

相关文档