基本数据挖掘技术.PPT

基本数据挖掘技术

K—平均值算法 (1)选择一个K值,用以确定簇的总数。 (2)在数据集中任意选择K个实例,它们是初始的簇中心。 (3)使用简单的欧氏距离将剩余实例赋给距离它们最近的簇中心。 (4)使用每个簇中的实例来计算每个簇新的平均值。 (5)如果新的平均值等于上次迭代的平均值,终止该过程。否则,用新平均值作为簇中心并重复步骤3~5。 K—平均值算举例 Instance X Y 1 1.0 1.5 2 1.0 4.5 3 2.0 1.5 4 2.0 3.5 5 3.0 2.5 6 5.0 6.0 K—平均值算举例 Instance X Y 1 1.0 1.5 2 1.0 4.5 3 2.0 1.5 4 2.0 3.5 5 3.0 2.5 6 5.0 6.0 第一次迭代结果 Distance(C1-1) = 0.00 Distance(C1-2) = 3.00 Distance(C1-3) = 1.00 Distance(C1-4) ≈ 2.24 Distance(C1-5) ≈ 2.24 Distance(C1-6) ≈ 6.02 Distance(C2-1) = 1.00 Distance(C2-2) ≈ 3.16 Distance(C2-3) = 0.00 Distance(C2-4) = 2.00 Distance(C2-5) ≈ 1.41 Distance(C2-6) ≈ 5.41 C1

文档评论(0)

1亿VIP精品文档

相关文档