基于集聚度增量的空间聚类算法 A Fast Algorithm of Spatial Clustering Based on Agglomeration.pdfVIP

基于集聚度增量的空间聚类算法 A Fast Algorithm of Spatial Clustering Based on Agglomeration.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第29卷第4期 地理与地理信息科学 VoI.29No.4 2013年7月 andGeo-InformationScience 2013 Geography July doi:10.7702/dlydIxxk 基于集聚度增量的空间聚类算法 陈娱1’2,许琚1*,徐敏政1’2 (1.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京lOOlOl;2.中国科学院大学,北京100049) 摘要:该文借鉴了复杂网络领域的模块度概念,构造了空间点集的集聚度函数。基于集聚度的增量值,提出一个快 速的空间聚类算法。实验证明,该值同点集的类间均方差(逝)与类内均方差(SSE)的比值(SSB/SSE)有相同的结 论,可以评价不同的点集在空间分布上的集聚程度(eP群簇结构是否明显),同时该算法可以在不预先设定聚类个 数的情况下快速有效地得到聚类结果。 关键词:空间聚类;群簇结构;集聚度;复杂网络;模块度 中图分类号:P208文献标识码:A 文章编号:1672—0504(2013)04—0104一05 0引言 1集聚度S值的定义 空间聚类的目的是对空间物体的集群性进行分 1.1模块度Q值 析,将其分为不同的子群[1]。聚类分析研究的经典 复杂网络的研究意在探寻事物之间错综复杂的 算法有K-means、DBSCAN算法等,其主要应用于空关系,挖掘出意想不到的规律。例如,城市路网、航 间聚类分析中。空间聚类算法中常用的有基于划分 线网络、社交网络等都是典型的复杂网络。在复杂 的方法、基于层次的方法和基于密度的方法[2]。基网络研究领域中,社区结构挖掘是一个研究热点。 于划分的方法是指在分类之初预先确定分类个数, 将网络划分为若干个群,群内节点间的连接较为紧 创建一个初始划分,然后循环再定位,从而改变节点 密,而群与群之间的连接较为稀疏,社区就是指这样 的归宿,最终得到最优聚类结果,其典型代表是经典 的群,社区结构挖掘其实就是复杂网络领域的聚类 的K-means算法[3]。系统聚类就是基于层次的方分析。如图1中的小型网络,它具有较为明显社区 法,不断地合并空间点直到聚至一个适当的分类个 结构(图2)。为了得到网络最优的社区结构,提出模 数。基于密度的方法主要思想是只要邻近区域的密 块度的概念。模块度即为网络呈现出的模块化的结 度超过某个阈值,就继续聚类,可以发现任意形状的 构,是衡量网络社区结构挖掘质量好坏的标准Is],模 类,DBSCAN是这类算法的代表[4]。 块度值越大则这种模块化结构越明显。其公式为: 上述算法存在着不同的缺陷,其中一个引起关 Q一∑(-,一日;) (1) 注较多的问题是:在不知道分类个数的情况下,如何 获得最优的聚类结果?例如在K-means算法中,必 须确定聚类个数之后,才能利用类内方差这个准则 函数判断最优的聚类结果。而在复杂网络研究领 域,模块度的概念被提出,用于评价复杂网络中节点 聚类质量的好坏,模块度值越大说明聚类结果越优。 如此则在复杂网络拓扑结构聚类中无需预先设定类 的个数。本文借鉴这个值的定义,构造了评价空间 聚类结果质量好坏的标准——集聚度;然后基于该 值提出了一个快速的层次聚类算法,可以在不预知 分类个数的情况下得到空间点集的最优聚类结果, 图1小型的网络 且时间复杂度较低。 n舀1Asmallnetwork 收稿日期:2013_02_27;修回日期:2013_04珈2 基金项目:国家自然科学基金项目;国家863计划项目(2012AAl2A211)

您可能关注的文档

文档评论(0)

000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档