聚类分析算法-read.pdfVIP

  • 1
  • 0
  • 约 4页
  • 2018-08-19 发布于天津
  • 举报
聚类分析算法-read

第三章 聚类分析算法 3.1 聚类分析概述 聚类 (clustering)是一个将数据集划分为若干组 (class)或类 (cluster)的 过程,并使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是 不相似的。相似或不相似的度最是基于数据对象描述的取值来确定的,通常是利用(各 对象间)距离来进行描述。 对于聚类没有一个统一和精确的定义,人们根据观察的角度和方法的不同,应用 的领域和范围的不同,给出了不同的定义: 定义3.1 良好分隔的聚类定义 (Well-SeparatedClusterDefinition):聚类是 一些点的集合,与不在聚类中的点相比,聚类中的每一个点彼此间更接近 (更相似)。 图3.1显示了适合于良好分隔的聚类定义的数据集合的外部特征。 巷 图3.1适合于良好分隔聚类定义的数据集合。 定义3.2荃于中心的聚类定义 (Center-basedClusterDefinition):聚类是一 些对象的集合,与其它聚类的 “中心”相比,在聚类中的对象更接近 (更相似)于本 聚类的 “中心”。聚类的 “中心”常常是一个质心 (聚类中所有的点的平均值),或者 是聚类的中心点 (

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档