- 265
- 0
- 约5.44千字
- 约 13页
- 2016-12-25 发布于重庆
- 举报
学 号: 1049721401349《互联网大规模数据分析技术》论文课程名称《互联网大规模数据分析技术》学 院计算机科学与技术学院专 业软件工程班 级计算机 1402 班姓 名谷鹏指导教师李琳2014——2015学年 第2学期基于kmeans算法的聚类分析引言数数据挖掘是数据库研究、开发和应用最活跃的分支科学之一,从大量数据中用非平凡的方法发现有用的知识和人们感兴趣的数据模式成了人们的一种自然需求 。随着数据挖掘研究的蓬勃发展,对于庞大的数据我们通常需要将其局分为几个类别,以方便对数据进行管理。因此出现很多数据挖掘的方法,其中聚簇是最基本的方法,它既可以独立地应用,也可以作为其他数据挖掘方法的前期工作。在 聚簇方法中,k-means算法是最著名和最常用的划分法之一,KMeans算法的基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。摘要 K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为
您可能关注的文档
最近下载
- 英语修辞学(Rhetoric) English Figures of Speech.ppt VIP
- 动态葡萄糖图谱报告护理应用专家共识2026.docx VIP
- 2026年浙江泰隆商业银行校园招聘笔试备考题库及答案解析.docx VIP
- [T_CAMRA 017—2021]铝合金车轮修复规范.docx VIP
- 干扰素调节因子在肿瘤发生中的研究进展.pdf VIP
- 不锈钢固溶热处理线自动控制系统的开发与应用.docx VIP
- 悬索桥主缆防护用S形钢丝+干空气除湿系统的应用.pdf VIP
- 中银汇通理财计划-中国银行.pdf VIP
- 2026住院医师规培-贵州-贵州住院医师规培(耳鼻咽喉科)历年参考题库含答案详解5卷试题.docx VIP
- 2026住院医师规培-贵州-贵州住院医师规培(妇产科)历年参考题库含答案详解5卷试题.docx VIP
原创力文档

文档评论(0)