基于K中心点数挖掘课程设计论文(原创).docVIP

  • 3
  • 0
  • 约2.63万字
  • 约 18页
  • 2016-10-09 发布于贵州
  • 举报

基于K中心点数挖掘课程设计论文(原创).doc

基于K中心点数挖掘课程设计论文(原创)

基于K-中心点算法实现 算法描述 k中心点算法:首先为每一个簇随意选择一个代表对象;剩余的对象其与代表的对象的距离分配给最近的一个簇。然后反复的用非代表对象来替代代表对象,以改进聚类的质量。聚类结果的质量用一个代价函数来估算,该函数度量对象与其参与对象之间的平均相异度。为了确定非代表对象是否是当前代表对象的好的替代,对于每一个非代表对象P,考虑以下四种情况。 第一种情况:P当前隶属于代表对象。如果被所取代作为代表对象,并且P离其他代表对象(ij)最近,则P重新分配给。 第二种情况:P当前隶属于代表对象。如果被所取代作为代表对象,并且P离其他代表对象最近,则P重新分配给。 第三种情况:P当前隶属于代表对象,(ij)。如果被所取代作为代表对象,并且P离其他代表对象最近,则对象的隶属不发生变化。 第四种情况:P当前隶属于代表对象,(ij)。如果被所取代作为代表对象,并且P离其他代表对象最近,则P重新分配给。 下面是我们这次实现这个k中心点算法的具体描述 输入:结果簇的个数k和包含n个对象的数据集合 输出:k个簇的集合,使得所有对象与其最近中心点的相异度总和最小 方法: 从n个对象的集合中随意选取k个对象作为初始化的中心点; repeat; 将每个剩余的对象指派到最近的中心点所代表的簇; 随机地选择一个非代表对象; 计算用交换代表对象Oj的总代价S;

文档评论(0)

1亿VIP精品文档

相关文档