空间聚类算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
空间聚类算法的研究 摘 要 信息技术的不断发展导致持续的数据收集和快速的数据积累。空间数据挖 掘是在空间数据库中提取隐藏的未知模式,而空间聚类是空间数据挖掘中一个 活跃的研究领域。 本文第一部分提出了一种新颖的启发式选择边界对象的快速空间聚类算法 DBSB。通过一个启发式函数近似选择相对于某个已知核心对象边界区域中的核 心对象和边界对象,通过核心对象的序列来快速地扩展它们所在的簇,直至找到 一些较小的簇。在此基础上再通过边界对象快速地合并某些簇,即算法通过两步 聚类,达到最终的聚类。理论分析和实验结果表明该算法有效可行。 随着分布式计算环境的广泛应用,由于数据和计算能力分布在不同的节点, 本文第二部分设计了一种基于反向k近邻的分布式聚类算法DCRkNN,该算法 在分布式数据挖掘的框架下利用反向k近邻的性质,分三个不同的阶段进行分 布式聚类。首先是局部模型的确立,通过局部模型来近似压缩局部站点的数据 集;其次在中央站点整合各分布的局部模型建立全局模型,最后根据全局模型 更新所有局部模型。同时DCRkNN算法易于扩展到分布式离群数据挖掘中。理 论与实验分析说明该算法和集中式聚类结果的质量相当,且在一定程度上保护 了各局部站点的敏感数据,DCRkNN算法执行效率高,分布节点之间的通信代 价小。 关键词;分布式数据挖掘,密度聚类,空间聚类,异常检测,反向k近邻 Researchon SpatialClusteringAlgorithms Abstract Advancesininformation haveledtotheeontinualcollectionand technologies accumulationofdatain data rapid repositories.Spatialmining,orknowledge in toextract or discoveryspatialdatabases,refersimplicitregularities,rules in hidden clustersin dataisan patterns largespatialdatabases.Findingspatial activeresearchareain data spatialmining. Thefirst this of thesis anovel part proposes density·basedspatialclustering with method border calledDBSB.The fast heuristicallyselectingobject algorithm theclustersaheuristicfunctiontochoosecore intheborder expands by objects oftheknown core then someclustersborder region object,and objcots. merges by That DBSB theultimat

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档