《数据挖掘》课程聚类分析.ppt

k中心点方法步骤 k中心点方法仍然基于最小化所有对象与其对应的参照点之间的相异度之和原则,使用的是绝对误差标准 (p是空间中的点,代表簇Cj中一个给定对象;oj是簇Cj中的代表对象) 通常该算法重复迭代,直到每个代表对象都成为它的簇的实际中心点 首先随意选择初始代表对象 只要能够提高结果聚类质量,迭代过程就使用非代表对象替换代表对象 聚类结果的质量用代价函数评估,该函数度量对象与其簇的代表对象之间的平均差异度 k中心点方法---代表对象替换 (1) + Oi + Oj p + Orandom 1. 重新分配给Oi + Oi + Oj p + Orandom 2. 重新分配给Orandom + Oi + Oj p + Orandom 3. 不发生变化 + Oi + Oj p + Orandom 4. 重新分配给Orandom 为了确定非代表对象Orandom是否能够替代当前代表对象Oj,对于每一个非代表对象p,考虑四种情况 k中心点方法---代表对象替换 (2) 重新分配将对代价函数产生影响,如果当前的代表对象被非代表对象所取代,代价函数就是计算绝对误差值的差 变换的总代价是所有非代表对象所产生的代价之和 总代价为负,实际的绝对误差E将减少,Oj可以被Orandom所取代 总代价为正,则本次迭代没有变化 k均值方法与k中心点方法比较 当存在噪声和离群点时,k中心点方法比k均值方法更

文档评论(0)

1亿VIP精品文档

相关文档