- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
空间聚类算法的研究
摘 要
信息技术的不断发展导致持续的数据收集和快速的数据积累。空间数据挖
掘是在空间数据库中提取隐藏的未知模式,而空间聚类是空间数据挖掘中一个
活跃的研究领域。
本文第一部分提出了一种新颖的启发式选择边界对象的快速空间聚类算法
DBSB。通过一个启发式函数近似选择相对于某个已知核心对象边界区域中的核
心对象和边界对象,通过核心对象的序列来快速地扩展它们所在的簇,直至找到
一些较小的簇。在此基础上再通过边界对象快速地合并某些簇,即算法通过两步
聚类,达到最终的聚类。理论分析和实验结果表明该算法有效可行。
随着分布式计算环境的广泛应用,由于数据和计算能力分布在不同的节点,
本文第二部分设计了一种基于反向k近邻的分布式聚类算法DCRkNN,该算法
在分布式数据挖掘的框架下利用反向k近邻的性质,分三个不同的阶段进行分
布式聚类。首先是局部模型的确立,通过局部模型来近似压缩局部站点的数据
集;其次在中央站点整合各分布的局部模型建立全局模型,最后根据全局模型
更新所有局部模型。同时DCRkNN算法易于扩展到分布式离群数据挖掘中。理
论与实验分析说明该算法和集中式聚类结果的质量相当,且在一定程度上保护
了各局部站点的敏感数据,DCRkNN算法执行效率高,分布节点之间的通信代
价小。
关键词;分布式数据挖掘,密度聚类,空间聚类,异常检测,反向k近邻
Researchon
SpatialClusteringAlgorithms
Abstract
Advancesininformation haveledtotheeontinualcollectionand
technologies
accumulationofdatain data
rapid repositories.Spatialmining,orknowledge
in toextract or
discoveryspatialdatabases,refersimplicitregularities,rules
in
hidden clustersin dataisan
patterns largespatialdatabases.Findingspatial
activeresearchareain data
spatialmining.
Thefirst this
of thesis anovel
part proposes density·basedspatialclustering
with
method border calledDBSB.The fast
heuristicallyselectingobject algorithm
theclustersaheuristicfunctiontochoosecore intheborder
expands by objects
oftheknown
core then someclustersborder
region object,and objcots.
merges by
That DBSB theultimat
您可能关注的文档
最近下载
- 急性冠脉综合征的护理.pptx VIP
- 工学一体化课程《小型网络安装与调试》工学一体化课程教学进度计划.pptx VIP
- 土石方工程安全培训课件(汇编).ppt VIP
- 2024年全球及中国电子级全氟聚醚(PFPE)行业头部企业市场占有率及排名调研报告.docx
- 城市社区建设中的居民自治问题及其对策研究——以岳阳市社区为例.docx VIP
- 河北省承德市事业单位招聘考试(职业能力倾向测验)题库审定版.docx VIP
- 最新苏教版五年级数学上册单元测试题及答案全套8全.pdf VIP
- 危险化学品安全风险智能化管控平台数据交换规范 2025版.pdf VIP
- 市政工程 室外管道工程施工.ppt VIP
- 口腔正畸健康知识讲座.pptx VIP
文档评论(0)