模式识别讲义--聚类分析.pptVIP

  • 3
  • 0
  • 约4.94千字
  • 约 42页
  • 2018-02-21 发布于河南
  • 举报
模式识别讲义--聚类分析

聚类分析 (Clustering Analysis) 分类与聚类的区别 分类:用已知类别的样本训练集来设计分类器(监督学习) 聚类(集群):用事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习) 聚类分析 解决主要问题 1.如何评价样本间的类似程度; 2.如何根据样本间的类似程度聚类。 特征量的类型 1.物理量:反映实际物理或几何意义,如重量 2.次序量:只反映次序关系,如产品等级等 3.名义量:只用数字代表各种状态,如性别编码 方法有效性 1.特征选取不当 2.特征选取不足 3.特征选取过多 4.量纲选取不当 模式相似性测度 距离测度:以两个矢量矢端的距离为基础 1.欧式距离:(Euclidean) 2.绝对值距离:(Manhattan) 3.切氏距离:(Chebyshev) 距离测度 4.明氏距离:(Minkowski) 5.马氏距离(Mahalanobis) 类的定义 1.集合S中任意两个元素xi,xj的距离dij满足如下条件之一,则S对于阈值h组成一类,h为阈值。 2.集合S中元素满足对于任一xi,存在xj的距离dij满足dij ≤h,则S对于阈值h组成一类,h为阈值。 3.若将集合任意分为两类S1,S2,这两类间的距离D(S1,S2)满足D(S

文档评论(0)

1亿VIP精品文档

相关文档