- 23
- 0
- 约2.95千字
- 约 10页
- 2016-12-25 发布于重庆
- 举报
聚类方法---K均值算法(K-means)应用举例
一.算法
按照聚类的原理和方法,主要的聚类算法可以分为以下几类:
(1) 基于划分的聚类:包括 1)k平均算法或称k均值算法(K-means);2)k中心点算法。
(2) 基于层次的聚类;
(3) 基于密度的聚类;
(4) 基于网格的聚类;
(5) 基于模型的聚类.
k均值(K-means)算法是一种简单使用的无监督学习算法,此种方法能够用于已知类数K的数据聚类和分析,基本步骤如下:
初始化:给定类的个数k,置j=0,从样本向量中任意选定k个向量作为聚类中心,,()。
其中,n为输入向量的维数,并记中心为的聚类块。
将每个样本向量,按下列欧几里得距离归入中心为的类中。
(1)
从新调整聚类中心,新的聚类中心由下式计算得出,即 , 式中: 是聚类块中的向量数。
如果(1)中的聚类中心()不再明显变换,就终止,否则 ,转(1)。
上述方法是一种迭代算法,可以采用下面的目标函数进行迭代,直到J不再明显改变为止。
二.算法应用
在本例中,利用k均值聚类方法,分析大中城市城镇居民家庭情况的相似性,表1为35个大中城市城镇居民家庭基本情况表。
把35个大中城市分为五类,每个城市用7个属性描述,即样本个数为35,样本向量维数7,采用K均值聚类算法进行分类,在算法公式(1)中,向量的维数n
您可能关注的文档
最近下载
- 五年级语文秋夜将晓教学反思.docx VIP
- 深度解析(2026)《RBT 033-2020微生物检测方法确认与验证指南》.pptx VIP
- JGJT1042011建筑工程冬期施工规程.doc VIP
- 2023年中考 湖北咸宁生物真题+答案.docx VIP
- 第十五届全国交通运输行业“极智杯”公路收费及监控员职业技能大赛理论题库.pdf VIP
- 2025年河北省生物会考试卷及答案高中.doc VIP
- 常见药物的作用.docx VIP
- 《医疗护理员安全喂食辅助照护规范》解析.docx VIP
- D-L 5190.4-2019 电力建设施工技术规范 第4部分:热工仪表及控制装置(高清可复制).pdf VIP
- 试论一带一路沿线国家当代青年交流合作的困境及其解决路径汇编.pdf VIP
原创力文档

文档评论(0)