- 84
- 0
- 约2.33千字
- 约 6页
- 2016-09-16 发布于安徽
- 举报
聚类的目标是使同一类对象的相似度尽可能地小;不同类对象之间的相似度尽可能地大。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。摘自 数据挖掘中的聚类分析研究综述 这篇论文。
1、层次聚类算法
1.1聚合聚类
1.1.1相似度依据距离不同:Single-Link:最近距离、Complete-Link:最远距离、Average-Link:平均距离
1.1.2最具代表性算法
1)CURE算法
特点:固定数目有代表性的点共同代表类
优点:识别形状复杂,大小不一的聚类,过滤孤立点
2)ROCK算法
特点:对CURE算法的改进
优点:同上,并适用于类别属性的数据
3)CHAMELEON算法
特点:利用了动态建模技术
1.2分解聚类
1.3优缺点
优点:适用于任意形状和任意属性的数据集;灵活控制不同层次的聚类粒度,强聚类能力
缺点:大大延长了算法的执行时间,不能回溯处理
?
2、分割聚类算法
2.1基于密度的聚类
2.1.1特点
将密度足够大的相邻区域连接,能有效处理异常数据,主要用于对空间数据的聚类
2.1.2典型算法
1)DBSCAN:不断生长足够高密度的区域
2)DENCLUE:根据数据点在属性空间中的密度进行聚类,密度和网格与处理的结合
3)OPTICS、DBCLASD、CU
您可能关注的文档
最近下载
- 湖州市产业投资发展集团有限公司招聘笔试参考题库附带答案详解.docx VIP
- 基于 AVL-FIRE 软件的生物柴油发动机排放特性研究与分析.doc VIP
- 红色爱国诗词100首.pdf VIP
- 随州市2026年3月高三二模物理试卷(含答案详解).pdf
- 沪教牛津版英语六年级下册【教学课件】Unit 8 Reading signs 第二课时.pptx VIP
- 无极500ds使用说明书中文版.pdf VIP
- 2022年河北雄安新区容东片区综合执法辅助人员考试真题.docx VIP
- 带电粒子在磁场中运动基础巩固练习.pdf VIP
- 大学物理期中考试及答案.docx VIP
- 2024年河北雄安新区容东片区综合执法辅助人员考试真题(附答案).docx VIP
原创力文档

文档评论(0)