- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘 Topic3-- 聚类分析 K-means K-medoids 聚类 2018/10/5 主要内容 K-means 算法 Matlab 程序实现 在图像分割上的简单应用 K-medoids 算法 k- 中心点聚类算法 --PAM K-medoids 改进算法 2018/10/5 基于划分的聚类方法 ? 构造 n 个对象数据库 D 的划分 , 将其划分成 k 个聚类 ? 启发式方法 : k- 平均值 ( k- means ) 和 k- 中心点 ( k- medoids ) 算 法 ? k- 平均值 (MacQueen67): 每个簇用该簇中对象的平均值来表示 ? k- 中心点或 PAM (Partition around medoids) (Kaufman Rousseeuw87): 每个簇用接近聚类中心的一个对象来表示 ? 这些启发式算法适合发现中小规模数据库中的球状聚类 ? 对于大规模数据库和处理任意形状的聚类 , 这些算法需要进 一步扩展 2018/10/5 K-means 聚类算法 ? 算法描述 1. 为中心向量 c 1 , c 2 , …, c k 初始化 k 个种子 2. 分组 : ? 将样本分配给距离其最近的中心向量 ? 由这些样本构造不相交( non-overlapping ) 的聚类 3. 确定中心 : ? 用各个聚类的中心向量作为新的中心 4. 重复分组和确定中心的步骤,直至算法收敛 2018/10/5 K-means 聚类算法 (续) ? 算法的具体过程 1. 从数据集 中任意选取 k 个赋给初始的聚类中心 c 1 , c 2 , …, c k ; 2. 对数据集中的每个样本点 x i ,计算其与各个聚类中心 c j 的欧氏距离并获取其类别标号: 3. 按下式重新计算 k 个聚类中心; 4. 重复步骤 2 和步骤 3 ,直到达到最大迭代次数为止。 1 { } N n n ? x 2 ( ) arg min || || , 1,..., , 1,..., i j j label i i N j k ? ? ? ? x c : ( ) , 1,2,..., s s label s j j j c j k N ? ? ? ? x 2018/10/5 Matlab 程序实现 function [M, j, e] = kmeans(X, K, Max_Its) [N,D]=size(X); I=randperm(N); M=X(I(1:K),:); Mo = M; for n=1:Max_Its for k=1:K Dist(:,k) = sum((X - repmat(M(k,:),N,1)).^2,2); end [i, j]=min(Dist, [], 2); for k=1:K if size(find(j==k))0 M(k, :) = mean(X(find(j==k), :)); end end 2018/10/5 Matlab 程序实现 (续) Z = zeros(N,K); for m=1:N Z(m,j(m)) = 1; end e = sum(sum(Z.*Dist)./N); fprintf(%d Error = %f\n, n, e); Mo = M; end 2018/10/5 k- 平均聚类算法 ( 续 ) ? 例 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8
文档评论(0)