《非监督聚类精.pptVIP

  • 2
  • 0
  • 约 30页
  • 2016-12-31 发布于北京
  • 举报
模式识别与神经网络 Pattern Recognition and Neural Network 第七章 非监督学习方法 内容目录 7.1 引言 有监督学习(supervised learning):用已知类别的样本训练分类器,以求对训练集的数据达到某种最优,并能推广到对新数据的分类?? 非监督学习(unsupervised learning) :样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)?? 非监督学习方法大致分为两大类:?? 基于概率密度函数估计的方法?? 基于样本间相似性度量的方法 方案对比 7.2 单峰子集的分离方法 思想:把特征空间分为若干个区域,在每个区域上混合概率密度函数是单峰的,每个单峰区域对应一个类 一维空间中的单峰分离: 对样本集KN={xi}应用直方图方法估计概率密度函数,找到概率密度函数的峰以及峰之间的谷底,以谷底为阈值对数据进行分割 一维空间中的单峰子集分离 多维空间投影方法 多维空间y中直接划分成单峰区域比较困难,把它投影到一维空间x中简化问题。 确定合适的投影方向u: 使投影{x=uTy}的方差最大,方差越大,类之间分离的程度也可能越大?? 样本协方差矩阵的最大特征值对应的特征向量满足这样的要求 存在问题:这样投影有时并不能产生多峰的边缘密度函数 投影方法举例 投影方法算法步骤 计算样本y协方差矩阵的最大

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档