- 5
- 0
- 约2.6千字
- 约 4页
- 2017-06-13 发布于北京
- 举报
引力势能聚类算法.doc
引力势能聚类算法 摘要:总结密度聚类算法存在的共性问题,即聚类之前的参数设定困难,据此提出密度聚类算法的改进目标。模拟万有引力势能的物理模型,结合核密度估计的概念,构建引力势能影响函数与引力势能密度函数,从而创造引力势能聚类算法,该算法能够克服聚类算法中的参数设定困难。详细介绍了该算法的基本原理、参数设定、聚类评判依据,算法步骤,并通过实际应用案例展示该算法在聚类分析和异常分析中的作用。 关键词:聚类;密度;引力势能;参数设定;异常分析 中图分类号:TP301 文献标识码:A 文章编号:1009-3044(2013)08-1889-05 放眼当今世界,聚类算法百花齐放。遗憾的是,多数算法要求用户在缺乏先验知识的条件下输入某些参数,这些参数设定往往带有盲目性,却显著影响聚类结果。此外,现实中的数据集很难找出全局最优参数能够反映聚类结构的本质特征。 相较之下,密度聚类算法具有许多优良特性,例如能发现任意形状的簇,适于处理噪声,对记录输入顺序不敏感,容易理解和使用范围广泛等等。但在聚类前,仍不免需要输入一些对结果敏感的参数。该文选择密度聚类算法作为研究方向,致力于找出更有效的算法模型,解决参数设定盲目性的难题。 1 密度聚类算法的共性问题 以上分析为密度聚类算法指明了改革方向,该文需要设计一种新算法:有能力发现任意形状的簇;允许各簇的密度级别差异悬殊;具有噪声处理能力;尽可能不依赖输入参
原创力文档

文档评论(0)