- 32
- 0
- 约7.91千字
- 约 65页
- 2019-01-02 发布于湖北
- 举报
聚 类 分 析 宋宜飞 主要内容 回顾 密度聚类方法 DBSCAN算法 OPTICS 算法 网格聚类方法 CLIQUE算法 回顾 聚类 聚类(clustering)也称为聚类分析,指将样本分到不同的组中使得同一组中的样本差异尽可能的小,而不同组中的样本差异尽可能的大。 聚类得到的不同的组称为簇(cluster)。 一个好的聚类方法将产生以下的聚类 最大化类中的相似性 最小化类间的相似性 回顾 聚类的分类: 划分聚类方法 层次聚类方法 密度聚类方法 网格聚类方法 模型聚类方法 k-means 算法 k-means 算法基本步骤 从 n个数据对象任意选择 k 个对象作为初始聚类中心; 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分; 重新计算每个(有变化)聚类的均值(中心对象); 计算标准测度函数,当满足一定条件,如函数收敛时,则算法终止;如果条件不满足则回到步骤2。 k-means优缺点 主要优点: 是解决聚类问题的一种经典算法,简单、快速。 对处理大数据集,该算法是相对可伸缩和高效率的。 当结果簇是密集的,它的效果较好。 主要缺点 在簇的平均值被定义的情况下才能使用。 必须事先给出k(要生成的簇的数目),而且对初值敏感,对于不同的初始值
您可能关注的文档
最近下载
- 15S202室内消火栓安装.docx VIP
- 蒙自辅警笔试题库及答案.doc VIP
- 南充市高2026届高三(一诊)英语试卷(含答案).pdf
- 幼儿园示范公开课:中班音乐《厨房音乐会》课件.pptx VIP
- 基于自我决定理论和IMB模型的肺康复锻炼在慢阻肺患者中的应用方案构建PPT.pdf
- 19S204-1:消防专用水泵选用及安装(一).pdf VIP
- 新目标大学英语视听说教程(第二版)第4册 参考答案.docx VIP
- 一建《水利》图文案例实操【重点推荐】.pdf VIP
- 医院门诊部主任竞选演讲稿PPT.pptx VIP
- 支委会2025年度组织生活会班子对照检查材料(五个带头)范文.docx VIP
原创力文档

文档评论(0)