网站大量收购闲置独家精品文档,联系QQ:2885784924

基于栅格数据的空间聚类.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于栅格数据的空间聚类.doc

基于栅格数据的空间聚类   【 摘 要 】 空间聚类是GIS空间分析的主要内容之一,传统矢量空间聚类算法存在数据冗余、结果不直观等弊端,介绍了基于栅格数据的空间聚类,并且针对现下主流的网格和密度方法的聚类算法存在效率和质量问题,提出了与栅格相结合的聚类挖掘算法,以期得到时间效率和聚类质量上的提高。   【 关键词 】 栅格;空间聚类;地图代数;距离变换   1 引言   空间聚类是GIS空间分析的主要内容之一,近几年来,随着空间数据挖掘研究的发展,空间聚类对于海量数据处理、大型空间数据库中有用信息和知识的提取等方面具有十分重要的意义。传统观念上,由于矢量数据模型对于现实世界中的抽象描述与表达更符合人的思维习惯,其分析方法自然采用了矢量途径,而对于栅格途径相应的研究及成果却少见;所见的国外文献中,大多限于栅格途径“ 可行性” 的研究,没有对其进行系统、深入的探讨。   传统的空间聚类算法都是基于矢量数据的,矢量空间分析方法具有简单、易操作的特点,但同时存在数据冗余、难以向高维和全形态扩展的缺点,为此本文着重于介绍基于栅格距离变换的空间聚类算法及其在各个领域的应用。   2 基于栅格的空间聚类算法   从空间聚类的算法过程来看,可以分为系统聚类、逐步分解和判别聚类。系统聚类由各点自成一类开始,逐步合并至一个适当的分类数目。与此相反,则为逐步分解。判别聚类是先确定若干聚类中心,然后逐点比较以确定各离散点的归属。从一般聚类的算法特征上看,目前主要有划分法(如K-means、K-medoids等)、层次法(如AGNES、BIRCH_l等)、基于密度的方法(如DBSCAN、DENCLUE等)和基于网格的方法(如STING等)。常用的空间聚类分析统计量有分布密度、相关系数、夹角余弦、指数相似系数、欧氏距离、绝对值距离、切比雪夫距离、兰氏距离、马氏距离、斜交空间距离、非参数方法等l0余种,尤以最短欧氏距离最为常用。本文就简单介绍基于最短欧式聚类的空间聚类栅格算法。   地图代数以栅格点集严密的量度作为其理论和方法论述的起点,来度量空间距离。其距离变换的核心是建立栅格平方平面,坐标值在栅格平面上均为整数,距离值与横纵坐标的平方和为一一映射关系,由于欧式距离需要开平方,为了增加计算精度,用距离平方值代替距离值参与运算。设距离平方值记为SqD,每个栅格单元的SqD值需要根据周同的8领域栅格单元的SqD来判断。这8个栅格单元的SqD值按图3依次标记为SqD1,SqD:,…, SqD8。   据此其变换的步骤为:   ① 赋所有实体点为0值,并赋所有非实体空间点为一足够大的正数M;② 顺序访问,即行号由0,l,2,…递增,列号由0,l,2,…递增,按下式改写各点平方值:SqD(0,0) =0,SqD(i,j) =MIN(SqDl(i,J),SqD2(i,j),SqD3(i,j),SqD4(i,j),SqD(i,j));③逆序访问并改写各点平方值:SqD(i,j) =MIN(Sqi)5(i,j),SqD6(i,j),SqD7(i,j),SqD8(i,j),SqD(i,j));④改写各点距离平方值为距离值:c(i,j) =INT{[SqD(i,j)] +0.5}。   经过地图代数栅格距离变换后的整个栅格空间被颜色不同的象素所填充,我们将其称为距离波,用黑线将那些色度值相同的栅格连接起来就构成了等距线。这些等距线与空间点集之间的关系就可以揭示空间聚类过程。经计算过后,各计算点被从最小距离到最大距离之间的间隔为1的等距线包围,然后就可以根据不同的条件(等距线数值)聚类。   3 与其他算法的结合   空间聚类(Spatial Clustering)是空间数据挖掘的重要组成部分,是聚类研究在空间数据分析中的应用.空间聚类应用广泛,如地理信息系统、生态环境、军事、市场分析等领域。通过空间聚类可以从空间数据集中发现隐含的信息或知识,包括空间实体聚集趋势、分布规律和发展变化趋势等。   3.1 研究现状   目前国内外对聚类挖掘算法的研究众多,其中基于网格的聚类算法和基于密度的聚类算法成为聚类算法中最重要的两种方法。   基于网格的聚类方法主要采用网格技术对空间进行划分,以单一的网格对象作为聚类处理目标,忽略其内部的所有数据属性。这样处理的一个突出优点就是速度快、聚类效率高。但是利用网格技术存在的最大问题是没有涉及聚类边界点的处理,可能造成聚类边界对象的丢失,导致聚类精度的降低。   而基于密度的聚类方法是将簇视为对象空间中被低密度区域分割开的高密度对象区域。此方法主要的优点就是可以发现任意形状的类簇,但是对主存要求较高,主要由于在密度聚类过程中对每一个对象必须与其他对象求解其距离。因此,合理地设计出质量精确和时间效率高的聚

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档