- 9
- 0
- 约5.39千字
- 约 16页
- 2018-05-11 发布于河南
- 举报
k-means均值算法
报告题目: 对k均值算法的研究
班 级:
学 号:
姓 名:
课题名称:k-means均值算法
前言
1.1研究的目的,意义及内容
聚类就是按照事物的某些属性, 把事物聚集成类, 使类间的相似性尽可能小, 类内相似性尽可能大。聚类是一个无监督的学习过程, 它同分类的根本区别在于: 分类是需要事先知道所依据的数据特征, 而聚类是要找到这个数据特征, 因此, 在很多应用中, 聚类分析作为一种数据预处理过程, 是进一步分析和处理数据的基础。例如在商务中, 聚类分析能够帮助市场分析人员从客户基本库中发现不同的客户群, 并且用购买模式来刻画不同的客户群的特征。聚类分析也能用于分类Web 文档来获得信息。作为数据挖掘的功能, 聚类分析可以作为一个获得数据分布情况、观察每个类的特征和对特定类进一步分析的独立工具。通过聚类, 能够识别密集和稀疏的区域, 发现全局的分布模式,以及数据属性之间的相互关系等。把数据库中的对象分类是数据挖掘的基本操作, 其准则是使属于同一类的个体间距离尽可能小, 而不同类个体间距离尽可能大, 为了找到效率高、通
原创力文档

文档评论(0)