网站大量收购独家精品文档,联系QQ:2885784924

基于单元格的多密度GMDBSCAN聚类算法-计算机软件与理论专业论文.docxVIP

基于单元格的多密度GMDBSCAN聚类算法-计算机软件与理论专业论文.docx

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
:鸷埘虫警 :鸷埘虫警 基于单元格的多密度G如BscAN聚类算法 兰州大学硕士学位论文 摘 要 聚类分析作为数据挖掘领域中的一个重要分支,研究数据对象的分类问题,在模式识 别、图像处理、市场研究以及生命科学等众多学科领域具有广泛的应用前景。DBSCAN算 法因为可以发现任意形状的聚类,排除噪声干扰等优点而备受关注。但是该算法只是简单 的使用全局参数,参数的设置缺乏针对性,将会导致对多密度的数据集的聚类效果不理想; 在对大数据集进行聚类时,算法时间复杂度较高,对大数据集适用性较差。本文结合空间 索引技术,提出了一种基于单元格的多密度聚类算法G加BSCAN,并对多个样本数据集 进行了实验,实验结果验证了GMDBSCAN算法的有效性。本文的主要工作如下: 提出了一种基于单元格的多密度聚类算法GMDBSCAN。从聚类质量和复杂度两方面 改进了DBSCAN算法。GMDBSCAN算法引入了基于空间的划分技术划分数据空间,以每 个单元格作为一个局部区域,根据每个单元格的密度确定局部的MinPts参数;根据类间的 相似度合并类;用基于距离的方法处理边界,提高了算法的聚类质量。GMDBSCAN算法 引入了SP.Tree空间索引结构,保存了数据的空间位置信息,为空间区域的邻域查询提供 了极大的方便,同时它只索引非空单元格,不仅节省了存储空间还降低了算法的时间复杂 性。本文还提出用位图存储数据的邻域关系,避免了反复查询和计算。 本文对GMDBSCAN算法的时间复杂度和空间复杂度进行分析。在模拟数据集和真实 数据集上进行了GIVIDBSCAN算法的性能测试,并对实验结果进行了分析。 关键词:数据挖掘;聚类;单元格密度;sP.Tree:局部MinPts;多密度 萄埘虫尊 萄埘虫尊 基于单元格的多密度G彻BScAN聚类算法 兰州大学硕士学位论文 Abstract As important and active branch of data mining,clustering attempt to discover valuable knowledge from huge unknown database.Furthermore,clustedng has been broadly applying in pattern recognition,image processing,market research,life science and on.DBSCAN is of the most popular algorithms in cluster analysis.It discover any clusters with arbitrary shape and separate noise.But this algorithm doesn’t choose parameter according to distributing of dataset.It just uses the global MinPts parameter of dataset simply,SO that the clustering result of varying density database is inaccurate.And when We use it to cluster large databases,we will cost too much time.In order to fix these problems,we propose GMDBSCAN algorithm based spatial index and鲥d technique.The primary research include as follows: A clustering algorithm based the unit鲥d density and spatial partition tree is presented for improving the performance and clustering quality of DBSCAN algorithm.At the part of clustering quality:We estimate the density distributing of dataset according to grid density,and decide the local_density.Then We cluster the local data.set by DBSCAN algorithm。At last,We combine all cl

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档