聚类〔无监督学习〕综述.pptVIP

  • 1
  • 0
  • 约2.5千字
  • 约 28页
  • 2017-05-19 发布于四川
  • 举报
聚类〔无监督学习〕综述

聚类(无监督学习)综述 聚类问题的描述(1) 聚类问题的描述(2) 聚类问题:根据给定的数据集, 要求寻找 T上的一个“好”的划分 (划分成m个类; m可以是已知的,也可以是未知的),满足约束条件: 聚类问题的描述(3) 模糊聚类问题:根据给定的数据集, 要求寻找 T上的一个“好”的模糊划分 (划分成m个模糊集),满足约束条件 : 聚类问题的要点 样本间的接近度(Proximity Measures) 聚类评价准则:“好”的聚类指什么? 聚类算法 聚类有效性检验(统计假设检验) 聚类结果解释(结合专家知识) 聚类的泛化能力或一致性或抗扰动能力 样本间的接近度度量 差异性度量(Dissimilarity Measure,DM) 对称性 自己与自己的相异性最小 例子:距离差异性度量 相似性度量(Similarity Measure,SM) 对称性 自己与自己的相似性最大 例子:高斯径向基函数 常用的接近度度量 点与点之间 点与集合之间 集合与集合之间 点与点之间——DM 点与点之间——SM 点与集合之间 集合与集合之间 聚类评价准则 类内样本间的接近度大,类间样本间的接近度小 ………… 主要聚类算法(1) N个样本聚为m类的可能聚类数S(N,m): 主要聚类算法(2) 顺序聚类(Seque

文档评论(0)

1亿VIP精品文档

相关文档