- 9
- 0
- 约小于1千字
- 约 18页
- 2019-10-27 发布于湖北
- 举报
K-means算法及在图像分割中的简单应用;主要内容;算法简介; k-means算法; 将样本分配给距离它们最近的中心向量,并使目标函数值减小
;算法要点;(2)选择评价聚类性能的准则函数:
误差平方和准则函数
给定数据集X,假设X包含k个聚类子集X1,X2,…XK;各个聚类子集中的样本数量分别为n1,n2,…,nk;各个聚类子集的均值代表点(也称聚类中心)分别为m1,m2,…,mk。则误差平方和准则函数公式为:
;(3)相似度的计算根据一个类中对象的平均值 来进行。
将所有对象随机分配到k个非空的类中。
计算每??类的平均值,并用该平均值代表相应的类。
根据每个对象与各个类中心的距离,分配给最近的类。
然后转(2),重新计算每个类的平均值。这个过程不断重复直到满足某个准则函数才停止。
;O; 对于 :
因为 ,所以将 分配给
对于 :
因为 ,所以将 分配给
更新,得到新类 和
计算平方误差准则,单个方差为
;;性能分析;针对K-means算法缺点的改进方法;k- center算法:解决k -means算法对于孤立点是敏感的问题
不采用簇中的平均值作为参照点,可以选用类中位置最中心的对象,即中心点作为参照点。
划分方法仍然是基于最小化所有对象与其参照点之间的相异度之和的原则来执行的。 ;k-modes 算法:实现对离散数据的快速聚类,处理分类属性型数据,例如:姓名、性别、年龄等。
采用差异度D来代替k-means算法中的距离,差异度越小,则表示距离越小。一个样本和一个聚类中心的差异度就是它们各个属性不相同的个数,属性相同为0,不同为1,并计算1的总和。因此D越大,即他的不相关程度越强。;16;17;18
您可能关注的文档
最近下载
- (最新)ISO 55013-2024 资产管理-数据资产管理指南(中文版-翻译-2024)(推荐下载).pdf VIP
- (QC小组活动专业能力)中级质量专业能力考试题库及答案.docx VIP
- 固体物理第一章晶体结构.pptx VIP
- 聚集性事件、药品群体不良事件调查处置标准操作规程.docx VIP
- DB52T 1692-2022 水利工程标识标牌技术规范.pdf VIP
- 2026年qc诊断师中级考试题库及答案.docx VIP
- 北航机械设计课程设计设计计算说明书.docx VIP
- (项目部)应急预案演练总结及评估报告.docx VIP
- 最新领军人才项目申报答辩汇报PPT模板.pptx VIP
- 2025年增资协议中英.doc
原创力文档

文档评论(0)