基本数据挖掘技术
K—平均值算法 (1)选择一个K值,用以确定簇的总数。 (2)在数据集中任意选择K个实例,它们是初始的簇中心。 (3)使用简单的欧氏距离将剩余实例赋给距离它们最近的簇中心。 (4)使用每个簇中的实例来计算每个簇新的平均值。 (5)如果新的平均值等于上次迭代的平均值,终止该过程。否则,用新平均值作为簇中心并重复步骤3~5。 K—平均值算举例 Instance X Y 1 1.0 1.5 2 1.0 4.5 3 2.0 1.5 4 2.0 3.5 5 3.0 2.5 6 5.0 6.0 K—平均值算举例 Instance X Y 1 1.0 1.5 2 1.0 4.5 3 2.0 1.5 4 2.0 3.5 5 3.0 2.5 6 5.0 6.0 第一次迭代结果 Distance(C1-1) = 0.00 Distance(C1-2) = 3.00 Distance(C1-3) = 1.00 Distance(C1-4) ≈ 2.24 Distance(C1-5) ≈ 2.24 Distance(C1-6) ≈ 6.02 Distance(C2-1) = 1.00 Distance(C2-2) ≈ 3.16 Distance(C2-3) = 0.00 Distance(C2-4) = 2.00 Distance(C2-5) ≈ 1.41 Distance(C2-6) ≈ 5.41 C1
您可能关注的文档
最近下载
- 国家开放大学《模拟电子电路》实验报告参考答案.pdf VIP
- 2025山西临汾曲沃县乡镇消防协管员招聘18人笔试备考题库及答案解析.docx VIP
- 浙江急救流程和操作技能培训教材-浙江急救指挥中心.PDF VIP
- 国家能源集团PPT:基于构网型储能的“沙戈荒”新能源基地源侧新型电力系统示范(29页 PPT).pptx VIP
- 临汾市古县2025年度公开招聘乡镇消防协管员的备考题库参考答案详解.docx VIP
- 小学古诗词大赛pp课件.ppt VIP
- T_BSCA 0007-2025(茶道疗愈师资能力培训与评价).pdf
- 2026婴幼儿发展引导员4级理论易错题练习试卷附答案.docx VIP
- 露天煤矿安全技术课件PPT.pptx
- 2025年安徽省高考生物试卷(含答案解析).docx
原创力文档

文档评论(0)