有关k均值聚类算法的理解.pdfVIP

  • 5
  • 0
  • 约3.29千字
  • 约 3页
  • 2021-11-24 发布于上海
  • 举报
如果对你有帮助,请下载使用! 有关 k- 均值聚类算法的理解 1.K- 均值聚类算法的历史: 聚类分析作为一种非监督学习方法, 是机器学习领域中的一个重 要的研究方向, 同时,聚类技术也是数据挖掘中进行数据处理的重要 分析工具和方法。 1967 年 MacQueen首次提出了 K 均值聚类算法 (K-means算法)。到目前为止用于科学和工业应用的诸多聚类算法 中一种极有影响的技术。 它是聚类方法中一个基本的划分方法, 常常 采用误差平方和准则函数作为聚类准则函数 迄今为止,很多聚类任务都选择该经典算法, K-means算法虽然 有能对大型数据集进行高效分类的优点,但 K-means算法必须事先确 定类的数目 k,而实际应用过程中, k 值是很难确定的,并且初始聚 类中心选择得不恰当会使算法迭代次数增加, 并在获得一个局部最优 值时终止,因此在实际应用中有一定的局限性。 半监督学习是近年来机器学习领域的一个研究热点, 已经出现了 很多半监督学习算法, 在很多实际应用中, 获取大量的无标号样本非 常容易,而获取有标签的样本通常需要出较大的代价。因而,相对大 量的无标签样本, 有标签的样本通常会很少。 传统的监督学习只能利 用少量的有标签样本学习, 而无监督学习只利用无标签样本学习。 半 监督学习的优越性则体现在能同时利用有标签样本和无标签样本学 习。 1 如果对你有帮助,请下载使用! 针对这种情况, 引入半监督学习的思想, 对部分已知分类样本运 用图论知识迭代确定 K-means 算法的 K值和初始聚类中心,然后在全 体样本集上进行 K-均值聚类算法。 2. K- 算法在遥感多光谱分类中的应用 基于 K-均值聚类的多光谱分类算法 近年来对高光谱与多光谱进行分类去混的研究方法很多, K- 均值 聚类算法与光谱相似度计算算法都属于成熟的分类算法 . 这类算法的 聚类原则是以数据的均值作为对象集的聚类中心。 均值体现的是数据 集的整体特征, 而掩盖了数据本身的特性。 无论是对高光谱还是对多 光谱进行分类的方法很多, K-均值算法属于聚类方法中一种成熟的方 法。 使用 ENVI将多光谱图像合成一幅伪彩色图像见图 1,图中可以看 出它由标有数字 1 的背景与标有数字 2 和3的两种不同的气泡及标有 数字4的两个气泡重叠处构成。 图1 原始图像 用 ENVI进行 K-means分类,分类结果如图 2,背景被分成标有数字 1的红色与标有数字 2 的绿色两类; 一种气泡被分为两类, 一类归为标 有数字 2的绿色的背景类, 一类为标有数字 4的蓝色的气泡类; 另外一 种气泡被分为标有数字 3的黄色与标有数字 5的浅蓝色两类。通过 ENVI 用 K-均值( K-means)进行分类, K-means算法对于两种气泡的分类效 果都很好。 图2 K- 均值分类后的图像

文档评论(0)

1亿VIP精品文档

相关文档