2021年k-means聚类算法简介.pdfVIP

  • 13
  • 0
  • 约8.06千字
  • 约 8页
  • 2021-01-01 发布于海南
  • 举报
k-means 聚类算法简介 k-means 算法是一种基于划分的聚类算法,它以 k 为参数,把 n 个数据对象分成 k 个 簇,使簇内具有较高的相似度,而簇间的相似度较低。 1. 基本思想 k-means 算法是根据给定的 n 个数据对象的数据集,构建 k 个划分聚类的方法,每个划 分聚类即为一个簇。该方法将数据划分为 n 个簇,每个簇至少有一个数据对象,每个数据 对象必须属于而且只能属于一个簇。 同时要满足同一簇中的数据对象相似度高, 不同簇中的 数据对象相似度较小。聚类相似度是利用各簇中对象的均值来进行计算的。 k-means 算法的处理流程如下。 首先, 随机地选择 k 个数据对象, 每个数据对象代表一个 簇中心,即选择 k 个初始中心;对剩余的每个对象,根据其与各簇中心的相似度(距离) , 将它赋给与其最相似的簇中心对应的簇; 然后重新计算每个簇中所有对象的平均值, 作为新 的簇中心

文档评论(0)

1亿VIP精品文档

相关文档