- 12
- 0
- 约8.06千字
- 约 66页
- 2015-11-01 发布于河南
- 举报
聚 类 分 析 宋宜飞 主要内容 回顾 密度聚类方法 DBSCAN算法 OPTICS 算法 网格聚类方法 CLIQUE算法 回顾 聚类 聚类(clustering)也称为聚类分析,指将样本分到不同的组中使得同一组中的样本差异尽可能的小,而不同组中的样本差异尽可能的大。 聚类得到的不同的组称为簇(cluster)。 一个好的聚类方法将产生以下的聚类 最大化类中的相似性 最小化类间的相似性 回顾 聚类的分类: 划分聚类方法 层次聚类方法 密度聚类方法 网格聚类方法 模型聚类方法 k-means 算法 k-means 算法基本步骤 从 n个数据对象任意选择 k 个对象作为初始聚类中心; 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分; 重新计算每个(有变化)聚类的均值(中心对象); 计算标准测度函数,当满足一定条件,如函数收敛时,则算法终止;如果条件不满足则回到步骤2。 k-means优缺点 主要优点: 是解决聚类问题的一种经典算法,简单、快速。 对处理大数据集,该算法是相对可伸缩和高效率的。 当结果簇是密集的,它的效果较好。 主要缺点 在簇的平均值被定义的情况下才能使用。 必须事先给出k(要生成的簇的数目),而且对初值敏感,对于不同的初始值
您可能关注的文档
最近下载
- F641090【复试】2024年烟台大学100700药学《复试药学专业知识之药理学.pdf VIP
- 2026年河北体育学院公开招聘人事代理工作人员8名笔试备考试题及答案解析.docx VIP
- 离职人员信息系统权限管理制度.pdf VIP
- 贵州省2025年4月高三年级适应性考试语文试卷(含答案解析).pdf
- 自考 00648 编辑学概论 分题型必背版(直接套用).docx VIP
- 肛周脓肿护理查房.pptx VIP
- 每周电梯安全排查报告模版.docx VIP
- 土方渣土运输管理的规定1.docx VIP
- 人形机器人技术要求 第4部分:运动控制编制说明.pdf VIP
- ISO13485与GMP医疗器械二合一全套体系文件汇编(手册+程序+表单).docx VIP
原创力文档

文档评论(0)