网站大量收购闲置独家精品文档,联系QQ:2885784924

数据挖掘之聚类算法综述.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 28卷第5期 (2012) 河西学院学报 Vo1.28No.5(2012) 数 据 挖 掘 之 聚 类 算 法 综 述 方 媛 车 启 凤 2 (1.河西学院信息技术中心;2.河西学院信息技术与传媒学院,甘肃 张掖 734000) 摘 要:近年来,数据挖掘技术的研究备受国内外关注,其主要原 因是信息技术发展产生了大量 分散的数据,迫切需要将这些数据转换成有用的信息和知识.此前的研究,主要集中于分类算法及应用 方面的研究,但某些特殊领域,如生物信息学研究等,需要通过聚类方法解决一些实际问题.本文从横 向深入分析了数据挖掘技术中聚类算法的发展,对层次法、划分法、模糊法,以及量子聚类、核聚类, 基于密度和网格等10种聚类算法的原理、过程和特点等都进行了比校详细的分析论述. 关键词:数据挖掘 :聚类算法 中图分类号:TP31l 文献标识码:A 文章编号 :1672-0520(2012)05—0066—25 数据挖掘(DataMining)技术就是能从大量数据中发现有用的知识的一种技术。主要面对的挖掘对象是 以结构化数据为主的关系数据库和数据仓库 [1].聚类分析是按照一定的性质和规律将事物进行分类的。就是 将类内相似性最大化,将类间相似性最小化的一种数据基本分析方法,非常适合挖掘数据的内在关联,为数 据集形成分类结构 [2].聚类分析作为数量统计中多元分析的一个分支。已经被广泛地研究若干年。在各种领 域都得到了广泛的应用.当人们使用数据挖掘工具对数据进行研究的时候,首要做的工作就是为大型数据库 的有效性和实际性的寻找适当的聚类方法,因此研究和运用聚类对于完成数据挖掘具有重要的理论价值和现 实意义,那么聚类算法也就越来越引起人们的关注了. 聚类根据 “物以类聚”的原则,按照数据间的相似程度进行区分和分类。其算法的选择取决于数据的类 型、聚类的目的和应用.由于各种聚类算法之间存在很多交集,它们之间并不是完全独立的,所以很难对聚 类算法进行严格意义上的划分,现就聚类算法的发展进程分为两类 :传统的聚类算法和新发展的聚类算法. 具体分类如图所示. 1 层次划分法 层次法对给定的数据对象集合像树一样进行层次似的分解.形成一棵聚类树。按层次分解的形成方式 自 底向上还是自顶向下,层次法可分为凝聚和分裂两大类.凝聚的方法,也称为 自底向上的方法,首先将每个 对象作为单独的一个聚类,然后根据性质和规则相继地合并相近的类。直到所有的对象都合并为一个聚类中 (层次的最上层),或者满足一定的终止条件为止.而分裂的方法,也称为 自顶向下的方法,正好与凝聚法相 反,首先将所有的对象都看做是一个聚类,然后在每一步中,上层类被分裂为下层更小的类,直到每个类只 包含一个单独的对象,或者也满足一个终止条件为止.分裂算法将生成与凝聚方法完全相同的类集.只是生 成过程的次序完全相反[. 在凝聚或者分裂层次聚类方法中,通常以用户定义的希望得到的类的数目作为结束条件.在类的合并或 收稿 日期:2012—04—26 . 作者简介:方媛 (1978-),女,甘肃酒泉人,讲师,研究方向:计算机软件开发及应用. · 72 · 方 媛 车启凤 :数据挖掘之聚类算法综述 l层次法}==雾 一一一 c—E一 K.MEANs l划分法 K-MEDOIDS Il L-大型数据库划分方法 (CLARANS) I基于密度的划分方法 (DBSCAN、OPTICS和DENCLUE) /基于网格的划分方法 (STING、CLIQUE、WAVE.CLUSTER) 1l基于模型舫法{_墓 l基于约束的方法 (COD) ‘ f基于模糊的方法 (FCM) I基于粒度的聚类

文档评论(0)

181****7662 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档