数据DATA挖掘中相异度矩阵.pptVIP

  • 4
  • 0
  • 约小于1千字
  • 约 11页
  • 2018-08-11 发布于江苏
  • 举报
相异度矩阵 2.相异度d(i,j)的具体计算因所使用的数据类型不同而不同,常用的数据类型包括: 区间标度变量 二元变量 标称型、序数型和比例标度型变量 混合类型的变量 3. 相异度矩阵是对象—对象结构的一种数据表达方式。 多数聚类算法都是建立在相异度矩阵基础上,如果数据是以数据矩阵形式给出的,就要将数据矩阵转化为相异度矩阵。 对象间的相似度或相异度是基于两个对象间的距离来计算的。 欧几里得距离和曼哈坦距离计算: 具体案例分析 小结 样本数据 属性矩阵 相似性矩阵 聚类 为样本划分所在类 分析结果 * * 1.相异度矩阵(Dissimilarity Matrix) 定义: 相异度矩阵存储n个对象两两之间的相似性,表现形式是一个n×n维的矩阵。d(i,j)是对象i和j之间相异性的量化表示,通常为非负值,两个对象越相似或“接近”,其值越接近0,越不同,其值越大,且d(i,j)= d(j,i),d(i,i)=0。 * * *

文档评论(0)

1亿VIP精品文档

相关文档