【论文】基于均值的无监督聚类方法.docxVIP

  • 8
  • 0
  • 约2.23万字
  • 约 26页
  • 2016-11-27 发布于北京
  • 举报

【论文】基于均值的无监督聚类方法.docx

摘要: 聚类(clustering),简单地说就是把相似的东西分到一组,同 分类(Classification)不同,对于一个分类器(classifier) ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个分类器(classifier) 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做监督学习( supervised learning ),而在聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起,因此,一个聚类算法通常只需要知道如何计算相似 度就可以开始工作了,因此聚类(clustering) 通常并不需要使用训练数据进行学习,这在 Machine Learning 中被称作无监督学习(unsupervised learning)。模式识别方法的首先要结局的一个问题就是特征的选择,目前许多方法只考虑了有监督学习的特征选择问题,对无监督学习的特征学则问题却涉及的很是很少,依据特征对分类结果的影响和特征之间相关性分析两个方面提出了一种基于K-均值聚类方法的特征学选择算法,用于无监督学习的特征选择问题。本次课题中,我们主要研究K-均值聚类方法。 K-均值聚类(K-means),属于聚类分析中基于划分的比较经典的算法之一,简捷性和适应性很强,对于多种数据类型都能进行聚类分析。而且

文档评论(0)

1亿VIP精品文档

相关文档