- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章聚类分析补充xs
一、1.案例 2.概念 3.欧几里得距离介绍 4.k平均聚类算法
二、1.案例 2.其他距离 3.k平均聚类算法 4.孤立点
案例
1. 8*2 的数据矩阵
a b 1 2 10 2 2 5 3 8 4 4 5 8 5 7 5 6 6 4 7 1 2 8 4 9
相异度矩阵
0.0 5.0 0.0 8.5 6.1 0.0 3.6 4.2 5.0 0.0 7.1 5.0 1.4 3.6 0.0 7.2 4.1 2.0 4.1 1.4 0.0 8.1 3.2 7.3 7.2 6.7 5.4 0.0 2.2 4.5 6.4 1.4 5.0 5.4 7.6 0
D(2,1)=
D(3,1)=
1 划分方法(PAM:PArtitioning method) 首先创建k个划分,k为要创建的划分个数;然后利用一个循环定位技术通过将对象从一个划分移到另一个划分来帮助改善划分质量。典型的划分方法包括:
k-means,k-medoids,CLARA(Clustering LARge Application),
CLARANS(Clustering Large Application based upon RANdomized Search). FCM
划分方法 : 把具有 n 个对象的数据库 D 构造成具有 k 个簇的集合的划分 给定 k ,找出有 k 个簇的一个划分使得所选择的划分准则最优
全局最优 : 穷举所有可能的划分
启发式方法 : k- 平均算法和 k- 中心点算法
k- 平均算法 (MacQueen’67): 每个簇用簇的中心表示
k- 中心点算法或围绕中心点的划分 PAM (Partitionaround medoids) (Kaufman Rousseeuw’87): 每一个簇用接近聚类中心的一个对象表示
K- 平均聚类算法
给定 k, k- 平均算法由以下四步来完成 :
把对象划分为 k 个非空的子集
随机的选择一些种子点作为目前划分的簇的质心。质心是簇的中心(平均点)
把每一个对象赋给最近的种子点
计算每个簇的质心。
重复第步,直到没有新的分配
a b 初始点1 1 2 10 0.0 5.0 8.5 3.6 7.1 7.2 8.1 2.2 初始点2 4 5 8 3.6 4.2 5.0 0.0 3.6 4.1 7.2 1.4 初始点3 6 6 4 7.2 4.1 2.0 4.1 1.4 0.0 5.4 5.4 0.0 4.1 2.0 0.0 1.4 0.0 5.4 1.4 1 2 3 4 5 6 7 8 1 6 6 4 6 6 6 4
每个点到初始点初始点1 1 2 10
初始点2 4 5 8
初始点3 6 6 4
新的质心产生
第二轮次计算的结果
new1 1 2 10 0.0 5.0 8.5 3.6 7.1 7.2 8.1 2.2 new2 4,8 4.5 8.5 2.9 4.3 5.7 0.7 4.3 4.7 7.4 0.7 new3 2,3,5,6,7 4.8 4 6.6 3.0 3.2 4.0 2.4 1.2 4.3 5.1 0.0 3.0 3.2 0.7 2.4 1.2 4.3 0.7 1 2 3 4 5 6 7 8 归属 new1 3 3 2 3 3 3 2
每个点到新质心 的距离
第一轮计算的结果
new1 2 10 1
New2 4.5 8.5 4,8
New3 4.8 4 2,3,5,6,7
每个点的归属簇,没有发生变化
第二种方案,选取不同的初始点
初始点1 7 1 2 8.1 3.2 7.3 7.2 6.7 5.4 0.0 7.6 初始点2 4 5 8 3.6 4.2 5.0 0.0 3.6 4.1 7.2 1.4 初始点3 6 6 4 7.2 4.1 2.0 4.1 1.4 0.0 5.4 5.4 3.6 3.2 2.0 0.0 1.4 0.0 0.0 1.4 1 2 3 4 5 6 7 8 初始点2 1 3 2 3 3 1 2 new1 2,7 3 7 3.2 2.2
文档评论(0)