ch 数据聚类.pptVIP

  • 4
  • 0
  • 约3.07千字
  • 约 22页
  • 2017-02-06 发布于江苏
  • 举报
第1章 绪论 * * 数据聚类 模式识别 钟珞等编著 武汉大学出版社 2006.9 本章主要内容 5.1 聚类的三个要点 5.2 模式相似性测度 5.3 聚类准则函数 5.4 分级聚类 5.5 动态聚类 5.6 有效性分析 第5章 数据聚类 5.1 聚类的三个要点 聚类是对样本按照它们之间的相似性进行分类,使类内样本有极大相似性,不同类间样本有极大的相异性。 聚类有三个要点: 1.相似性度量:解决相似性的测度问题。 2.聚类准则:选择准则函数,使聚类最佳。 3.聚类算法:设计聚类算法,达到最好的聚类结果。 第5章 数据聚类 5.2 模式相似性测度 5.2.1 相似性测度 设:X,X’为两个d维的特征向量,则可定义: 1.欧氏距离 特点:在各向均匀分布时是合理的。 2.马氏距离 D=[(X-X’)T?-1(X-X’)]1/2 其中?为协方差矩阵 3.明氏距离 当q=1时为曼哈坦距离 4.夹角余弦 第5章 数据聚类

文档评论(0)

1亿VIP精品文档

相关文档