商务智能理论与应用6kmeans算法.pptxVIP

  • 2
  • 0
  • 约5.74千字
  • 约 38页
  • 2023-09-18 发布于江苏
  • 举报
聚类分析K-means算法 李广明2023/9/171 聚类分析概念聚类与分类的不同在于:分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法。聚类属于无监督学习,相比于分类,聚类不依赖预定义的类和类标号的训练实例。 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。2023/9/172 聚类算法可以用来完成对l维特征向量的分组。对应于相同地面类型的点,如水,将其聚类在一起形成一组。一旦这样分组以后,分析人员就可以通过每一组中的样本点和地面数据的参考信息相联系来识别地面类型。2023/9/173 聚类分析中的数据类型2023/9/174 相异度计算2023/9/175 区间标度变量2023/9/176 对象间的相似度和相异度对象间的相似度和相异度是基于两个对象间的距离来计算的。标量也就是无方向意义的数字,也叫标度变量。现在先考虑元素的所有特征属性都是标量的情况。例如,计算X={2,1,102}和Y={1,3,2}的相异度。一种很自然的想法是用两者的欧几里得距离来作为相异度,欧几里得距离的定义如下:其意义就是两个元素在欧氏空间中的集合距离,因为其直观易懂且可解释

文档评论(0)

1亿VIP精品文档

相关文档