一种基于场模型的空间聚类方法-遥感学报.doc

一种基于场模型的空间聚类方法-遥感学报.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于场模型的空间聚类方法-遥感学报.doc

基于场论的空间聚类算法?基金项目:国家863计划项目(2009AA12Z206);地理空间信息工程国家测绘局重点实验室开放基金重点项目(200805);江苏省资源环境信息工程重点实验室(中国矿业大学)开放基金项目 第一作者简介:邓敏(1974-),男,江西临川人,博士,教授,博士生导师,主要研究方向为时空数据挖掘、推理与分析,发表论文90余篇。Email: dengmin208@ 邓敏1 刘启亮1 李光强1 程涛2 (1 中南大学 测绘与国土信息工程系,长沙,410083;2. 英国伦敦大学 城市、环境与地理信息工程系, 伦敦) 摘 要:空间聚类作为空间数据挖掘和空间分析的主要手段之一常用于揭示空间数据的分布规律以及探测空间异常。现有的空间聚类算法难以适应空间密度变化较大的情形,并且需要用户输入参数。为此,本文从空间数据场的角度出发,提出了一种适用于空间聚类的场—凝聚场,并给出了一种新的空间聚类度量指标(即凝聚力)。进而,提出了一种基于场论的空间聚类算法(简称FTSC算法)。该算法根据凝聚力的矢量计算获取每个实体的邻近实体,并通过递归搜索的策略,生成一系列不同的空间簇。通过模拟实验验证、经典算法比较和实际应用分析,可以发现本文提出的算法具有三个方面的优势:(1)不需要用户输入参数;(2)能够发现任意形状的空间簇;(3)能够很好适应空间数据分布不均匀的特性。 关键词:空间聚类;凝聚力;场论;空间数据挖掘 引言 空间聚类是地理信息科学与计算机科学领域共同关注的一个问题。空间聚类技术已广泛应用于地理学、制图学、地质学、遥感学、生物学、经济学等众多领域(Blackman Popoli, 1999; Bar-shalom Blair, 2000; Hofmann-wellenhof 等, 1994; 毛政元 李霖, 2004),主要用于揭示空间数据的分布规律,或者探测空间离群点(亦称空间异常)。 现有的空间聚类算法大致可以划分为:(1)基于划分的聚类算法,代表算法有k-Means(Macqueen, 1967)、k-Mediods(Ng Han, 1994)、FCM(Dave Bhaswan, 1992)等。基于划分的聚类算法需要首先给定聚类数目和目标函数,然后随机选择聚类中心,通过迭代不断降低目标函数的误差,直到目标函数收敛??一定阈值时,完成聚类。这类算法需要较多的先验信息来确定输入参数和收敛阈值,并且这些参数和阈值在聚类过程中是固定的,很难适应空间密度变化较大的情况,聚类结果严重依赖初始聚类中心的选择,而且不能发现任意形状的空间簇。(2)基于层次的聚类算法,代表算法有BIRCH(Zhang 等, 1998)、CURE(Guha 等, 1998)、ROCK(Guha 等, 1999)、CHAMELEON(Karypis 等, 1999)和基于引力的聚类算法(Wright, 1977; 淦文燕等, 2006)。基于层次的聚类算法又可以分为凝聚法和分裂法。前者从每个实体出发,通过反复聚合,从而得到不同层次的聚类簇;后者对整个数据集反复进行分裂,直至所有数据被分裂为单目标的簇,从而得到不同层次的聚类簇。层次聚类算法采用固定的分裂或聚合度量阈值,实质上假设了空间实体分布的均匀性。(3)基于密度或距离的聚类算法,代表算法有DBSCAN(Ester等, 1996)、VDBSCAN(Liu 等, 2007)、OPTICS(Ankerst 等, 1999)、ADBSC(李光强等, 2009)、DDBSC(李光强等, 2008)等。基于密度的聚类方法将局部密度大于给定阈值的实体聚为一类,能够发现任意形状的簇,具有一定的抗噪能力。但是,基于密度的聚类方法使用的参数有时很难确定,且这些参数在聚类过程中保持固定,从而难以适应空间密度变化大的情况,聚类结果易受邻域内空间离群点的影响。基于距离的聚类算法将实体间空间距离和非空间属性距离均小于一定阈值的实体聚为一类,不考虑非空间属性时等同于MinPts=1的基于密度的聚类方法,亦存在阈值不易确定且很难适应空间分布不均匀情况下聚类的缺陷。(4)基于图论的聚类算法,代表算法有ZEMST(Zahn, 1971)、SFMST(Paivinen, 2005)、AUTOCLUST(Estivill-Castro Lee, 2000)等。基于图论的聚类算法首先在全部数据集内构建一个完全图,每个实体都视为图的一个顶点,继而通过打断图的不一致边,形成一系列的子图,每个子图即视为一个簇。然而当空间分布不均匀时,不一致边很难确定。(5)混合聚类算法,代表算法有STING(Wang 等, 1997)、Wave Cluster(Sheikholeslami 等, 1998)、CLIQUE(Agrawal 等

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档