- 5
- 0
- 约1.05万字
- 约 10页
- 2016-11-26 发布于重庆
- 举报
最全的聚类知识
聚类分析
?
聚类(clustering)就是将数据对象分组成为多个类或簇(cluster),在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。相异度是基于描述对象的属性值来计算的。距离是经常采用的度量方式。聚类分析源于许多研究领域,包括数据挖掘,统计学,生物学,以及机器学习。
?
将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。在许多应用中,一个簇中的数据对象可以被作为一个整体来对待
?
“聚类的典型应用是什么?”在商业上,聚类能帮助市场分析人员从客户基本库中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征。
?
聚类也能用于对Web 上的文档进行分类,以发现信息。作为一个数据挖掘的功能,聚类分析能作为一个独立的工具来获得数据分布的情况,观察每个簇的特点,集中对特定的某些簇作进一步的分析。此外,聚类分析可以作为其他算法(如分类等)的预处理步骤,这些算法再在生成的簇上进行处理
?
作为统计学的一个分支,聚类分析已经被广泛地研究了许多年,主要集中在基于距离的聚类分析。基于k-means(k-平均值),k-medoids(k-中心)和其他一些方法的聚类分析工具已经被加入到许多统计分析软件包或系统中,例如S-Plus,SPSS,以及SAS。
?
您可能关注的文档
最近下载
- 国家标准 NYT 3437-2019 沼气工程安全管理规范.pdf VIP
- 安全科学原理(理论知识)试题及答案.doc VIP
- 2025年(安全工程)安全科学原理试题及答案.doc VIP
- 2025 年大学安全工程(安全科学原理)上学期期末测试卷.doc VIP
- 阿里云DataClaw:如何让Agent安全访问数据(2026年).pdf
- TGXAS 697-2024 融水苗族服饰.pdf VIP
- 2025 年大学安全工程(安全科学原理)试题及答案.doc VIP
- 2026年DataClaw:如何让 Agent安全访问数据报告.docx
- 安全科学原理期末考试试题.docx VIP
- 东南A5翼舞_汽车使用手册用户操作图示图解详解驾驶指南车主车辆说明书电子版.pdf VIP
原创力文档

文档评论(0)