- 5
- 0
- 约6.53千字
- 约 7页
- 2019-02-19 发布于广东
- 举报
基于划分聚类法的文献综述
1引言
聚类分析是一种重要的无监督学习方法,作为数据分析的工具,其重要性 在各个领域都得到了广泛的认可.聚类分析的廿的是寻找数据集中的“自然分 组”,即所谓的“簇”.通俗地讲,簇是指相似元素的集合,聚类分析就是一个 在数据集中寻找相似元素集合的无监督学习过程.來自不同应用领域的数据集 具冇不同的特点,人们对数据进行聚类分析的廿的也不尽相同,聚类分析的方 法因数据集而异,因使用目的而异?当前,聚类分析的新方法层出不穷,纵观齐 种聚类算法,它们使用的技术互不相同,其理论背景又彼此交叉、重叠,很难找 到一个统一的标准对其进行归类。
聚类分析的方法可分为基于层次的聚类方法、基于划分的聚类方法、基于图 论的聚类方法、基于密度和网格的方法等.这些方法虽然从不同角度使用不同的 理论方法研究聚类分析,但对于不同的实际问题,聚类分析中的一些基本内容始 终是人们关注的焦点。其中,划分法通常是指给定数据库,其中有N个元素,采 用分裂法将其构造为K个组,每一个分组就代表一个聚类,KNo而且这K个分 组满足下列条件:(1)每一个分组至少包含一个数据纪录;(2)每一个数据纪录属 于且仅属于一个分组;对于给定的K,算法首先给出一个初始的分组方法,以通 过反复迭代的方法改变分组,使得每一次改进之后的分组方案都较前一次好。我 们通常使用的K-MEANS算法、K-MODES算法、CLARA
原创力文档

文档评论(0)