基于划分聚类法的文献综述概要
基于划分聚类法的文献综述 引言 算法 应用 总结 引言 聚类分析是一种重要的无监督学习方法,作为数据分析的工具,其重要性在各个领域都得到了广泛的认可。 目的:是寻找数据集中的“自然分组”,即所谓“簇”。 通俗地讲, 簇是指相似元素的集合,聚类分析就是一个在数据集中寻找相似元素集合的无监督学习过程。 分类:聚类分析的方法可分为基于层次的聚类方法、基于划分的聚类方法、基于模型的聚类方法、基于密度和网格的聚类方法等。本文将介绍基于划分的聚类方法。 本课题简单地阐述了经典 K-modes与快速全局K-means聚类算法的基本思想及算法流程。 k-modes算法采用差异度来代替k-means算法中的距离。k-modes算法中差异度越小,则表示距离越小。一个样本和一个聚类中心的差异度就是它们各个属性不相同的个数,不相同则记为一,最后计算一的总和。这个和就是某个样本到某个聚类中心的差异度。该样本属于差异度最小的聚类中心。 算法 算法 k-means 算法的工作过程说明如下: 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。 缺点:k-mea
您可能关注的文档
- 基于MC14433的3位半数字万用表_原创概要.doc
- 基于modbus协议的模拟温度采集器概要.doc
- 基于NRC(第十版)公式的动态配方的制作(净能体系)概要.doc
- 基于PROE的注塑模具设计概要.doc
- 基于Qt的p2p局域网聊天和文件传输软件概要.doc
- 基于Quartus的设计输入方法概要.ppt
- 基于RFID的数字化仓库管理系统设计与实现概要.ppt
- 基于SIMULINK的OFDM通信系统的仿真概要.doc
- 基于STC89C82的电子万年历概要.doc
- 基于VISSIM平台的复杂立交桥交通环境仿真报告概要.doc
- 丹东市东港市2025-2026学年第二学期四年级语文期中考试卷(部编版含答案).docx
- 2026年金融行业线上理财、线下服务、线上线下融合分析报告.docx
- 2026年锦州市太和区社区工作者招聘考试模拟试题及答案解析.docx
- 2026年互联网行业会员体系设计与权益管理研究报告.docx
- 2026年环保设备行业市场趋势与技术创新报告.docx
- 2026年互联网行业供应商淘汰机制研究分析.docx
- 2026年新能源汽车行业报告:技术创新与市场布局洞察.docx
- 2026年新材料产业研究报告及行业应用分析.docx
- 2026年新能源车行业政策解读与市场分析报告.docx
- 2026年智能家居市场用户行为研究报告及产品创新方向.docx
原创力文档

文档评论(0)