- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次迭代思想的聚类算法的研究.pdf
第 24 卷第 3 期
2011 年 05 月
唐山学院学报 Vol. 24 No.3
May.2011 Journal of Tangshan College
基于层次迭代思想的聚类算法的研究
彭宏玉1 ,柴旭光2 ,陈晓纪2
(1.唐山学院计算机系,河北唐山 063000 , 2. 邢台职业技术学院信息工程系,洞北邢台 054000)
摘要:聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方
法。通过基于迭代思想的聚类算法,可对给定的数据对象集合进行层次分解,最终将样本空间分类
成有聚类集合。
关键词:数据挖掘$聚类分析 s层次算法
中图分类号: TP301. 6 文献标识码 :A 文章编号 :1672 一 349X(2011)03 - 0086 - 02
The Clustering Algorithm of Level Lterated Theory
PENG Hong-yu
1
,CHAI Xu-guang
2
,CHEN Xiao-W
(1. Tangshan College , Tangshan 063000 , China , 2. Xingtai Polytechnic College , Xingtai 054000 ,China)
Abstract: Cluster analysis is a major research field in data mining which also is an important
means and method of data partitioning or grouping. Cluster algorithm can conduct the hierarchi-
cal decomposition of given data sets and finally classify the sample spatial assortments into cluste-
rmg sets.
Key Woros: data mining; cluster analysis; hierarchical algorithm
。 引言
聚类是数据挖掘中的一种重要技术,是分析数据并从中
发现有用信息的一种有效手段。通过聚类,人们能够识别密
集和稀疏的区域,发现全局的分布模式以及数据属性之间有
趣的相互关系.聚类分析在客户分类、基因识另IJ 、 www 文
本分类、空间数据处理、卫星照片分析、医疗图像自动检测等
领域有着广泛的应用川,而其本身的研究也是一个蓬勃发展
的领域,数据挖掘、统计学、机器学习、空间数据库技术、生物
学和市场学的发展推动着聚类分析研究的进展,使它已成为
数据挖掘研究中的一个热点.与其他数据挖掘方法不同,在
进行聚类分析前用户一般并不知道数据集的特征。因此,从
某种角度看,聚类分析是一种元监督的学习过程,是基于观
察的学习而不是基于实例的学习.通常的聚类分析算法可
分为划分方法、层次方法、基于密度的方法I叫.
(1)划分方法 (partitioning method)
给定一个 n 个对象或元组的数据库,一个划分方法构建
数据的 K 个划分,每个划分表示一个聚类,并且 K=n.
也就是说,它将数据划分为 K 个组,同时满足如下要求 z 每
个组至少包含一个对象$每个对象必须属于且只属于一个
组,同时某些模糊划分技术中第二个要求可以放宽.
lIt稿日期 :2011-03-29
(2)层次方法(hierarchical method)
层次的方法对给定的数据对象集合进行层次的分解.
根据层次的分解如何形成,层次的方法可以分为凝聚的和分
裂的。凝聚的方法,也称为自底向上的方法,一开始将每个
对象作为单独的一个组,然后相继地合并相近的对象或组,
直到所有的组合并为一个(层次的最上层) ,或者达到一个终
止条件。分裂的方法,也称为自顶向下的方法,一开始将所
有的对象置于一个聚类中.在迭代的每一步中,一个类被分
裂为更小的类,直到最终每个对象在单独的一个类中,或者
达到一个终止条件。
(3)基于密度的方法(densit沪based method
绝大多数划分方法基于对象之间的距离进行聚类。这样
的方法只能发现球状的类,而在发现任意形状的类上遇到了
困难。随之提出了基于密度的另一类聚类方法,其主要思想
是 g只要临近区域的密度(对象或数据点的数目)超过某个阔
值,就继续聚类.也就是说,对给定类中的每个数据点,在一
个给定的范围的区域中必须至少包含某个数目的点.这样的
方法可以用来过滤噪声孤立点数据,发现任意形状的聚类[S].
本文通过分析研究以上算法,提出了基于层次迭代思想
的聚类算法.
作者简介:~宏玉0977-) ,
您可能关注的文档
最近下载
- 刑事诉讼法(中英文对照).doc VIP
- 司法考试复习强化训练题(二)(司法考试卷一(综合知识)考试卷).doc VIP
- 2024年09月华夏银行总行社会招考笔试历年参考题库附带答案详解 .docx
- 《Zbrush雕刻》课件——第二章_ZBrush界面与基础操作讲解.pptx VIP
- 工程总承包计量计价百问百答(完整合集)(1).pdf VIP
- 青岛版科学四年级下册第四单元《植物的生长》大单元整体教学设计.docx
- 电子商务物流管理高职全套完整教学课件.pptx
- (高清版)DB43∕T 1358-2017 地质灾害治理工程质量验收规范 .pdf VIP
- 北师大版(7-9年级)数学教材总目录.pdf VIP
- 读《教师如何快速成长》有感.pptx VIP
文档评论(0)