使用knn方法的信息论聚类选读.docxVIP

  • 8
  • 0
  • 约1.08万字
  • 约 23页
  • 2017-04-18 发布于湖北
  • 举报
使用knn方法的信息论聚类 摘要 我们发展了一种新的基于使用knn方法的密度聚类的隐式估计无参信息论聚类算法。相较于核函数算法,我们的分层knn方法关于参数选择方面是非常具有鲁棒性的,以及其一个关键的指标是能够探测不同规模的距离。尤其重要的是使用了两个不同的取决于聚类内部的熵或者交叉类的交叉熵决定的k值,和为了最终的聚类在不同的聚类方法里选择出一个聚类集合的使用。我们进行了聚类的实验和得到了满意的效果。 Introduction 聚类在模式识别和机器学习领域是基础、重要的组成部分。在这个领域,有大量的文献和聚类方法,例如参考文献[1][2]大体的介绍,或者是[3][9]再这个领域的特别的工作。很多方法都是采用局部的方法,就比较一对数据点的距离这方面来说,就有像单一链接的层次聚类[10]及其变体[11].众所周知的全局方法就是k-means,其在类[12]的方差方面优化了紧性准则。因此,这个方法仅仅采用了数据的二阶统计量。 这些阐述关键的意义是最近的发展的基于信息论的全局聚类的成本函数,如熵、散度或者互信息,这同策略包含了更高阶的统计信息。如图例所示,一阶和二阶的统计在图一所示函数间是不足区别的。一些在这个方向做出尝试的包括[14][15],提出了确定的退火方法,即根据最大熵值概率分布,采样点和聚类代表相关。一个相关方法应该于两列聚类的研究被提出在[16],基于平均场理论近似于最小

文档评论(0)

1亿VIP精品文档

相关文档