(52页PPT)第14章聚类方法.pptx

第十四章

聚类方法

相似度或距离假设有n个样本,每个样本由m个属性的特征向量组成,样本合集可以用矩阵X表示聚类的核心概念是相似度(similarity)或距离(distance),有多种相似度或距离定义。因为相似度直接影响聚类的结果,所以其选择是聚类的根本问题。

闵可夫斯基距离闵可夫斯基距离越大相似度越小,距离越小相似度越大。给定样本集合X,X是m维实数向量空间Rm中点的集合,其中样本xi与样本xj的闵可夫斯基距离(Minkowskidistance)定义为

闵可夫斯基距离当p=2时称为欧氏距离(Euclideandistance)当p=1时称为曼哈顿距离(Manhattandi

文档评论(0)

1亿VIP精品文档

相关文档