6第六章非监督学习方法——选.pptVIP

  • 3
  • 0
  • 约 25页
  • 2017-09-05 发布于江苏
  • 举报
第六章 非监督学习方法 郝红卫 第六章 非监督学习方法 6.1 引言 6.2 动态聚类方法 6.3 讨论 引 言 前面讨论的各种方法都是首先利用已知类别标号的样本集进行分类器设计,然后再进行分类 如果样本集没有类别标号,怎么办? 这就引出了非监督学习方法 引 言 研究非监督方法的必要性 收集并标记大型样本库非常费时费力(如语音) 原始数据没有明显的类别信息,或事先不知道待处理数据的具体情况,缺少形成模式类过程的知识(如卫星遥感图像、数据挖掘方面的大型应用) 待分类模式的性质会随着时间发生缓慢的变化(如卫星云图) 非监督方法可以揭示观测数据的一些内部结构和规律,便于有针对性地设计分类器 可以用于预分类(多级分类) 引 言 非监督学习方法实际上是对数据进行分组(grouping) 或聚类 (clustering) 的过程 尽管得到的聚类算法没有明显的理论性,但它们确实是模式识别中非常有用的技术 具体方法有很多,最常用的是动态聚类方法 动态聚类方法 动态聚类方法是一种最常用的方法,要点: 选定某种距离度量作为样本间的相似性度量 确定某个评价聚类结果质量的准则函数 给定某个初始分类,然后用迭代算法找出使准则函数取极值的最好聚类结果 动态聚类方法 C-均值算法(K-均值算法) 距离度量:欧式距离 准则函数:误差平方和 初始分类:先选一些代表点作为聚类的核心,然后把其

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档