基于GIS 空间数据挖掘的研究综述.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
. .    本文档下载自 HYPERLINK / 文库下载网,内容可能不完整,您可以点击以下网址继续阅读或下载:  HYPERLINK /doc/2dc83b7c27284b73f24250e7.html /doc/2dc83b7c27284b73f24250e7.html 基于GIS的空间数据挖掘研究综述 数据挖掘论文 科技信息○计算机与信息技术○SCIENCE&TECHNOLOGYINFORMATION2007年第26期 基于GIS的空间数据挖掘研究综述 杨霞 (成都职业技术学院国际软件学院教师 四川 成都 610000) 摘要:空间数据挖掘是数据挖掘的一个重要分支,它对于理解空间数据,寻找空间数据之间、空间与非空间数据之间内在关系,以简洁方式表达空间数据规律起着重要作用。 关键字:GIS;空间数据挖掘;空间数据 数据挖掘技术是数据量急剧膨胀的需求,有着较强的实用性,所 市场营销、以尽管这项技术刚刚起步,但己经成功地应用于科学研究、 金融投资、欺诈检测、医学、体育等方面,并在更为广泛的领域中显示出了诱人的前景。 空间数据挖掘就是其中的一个很有发展前景的应用领域。随着大量空间数据从遥感、地理信息系统、多媒体系统、医学和卫星图像等多种应用中收集出来,这些数据的复杂程度和数量都远远超出人脑的分析能力。空间数据库具有保存这些由空间数据类型和对象之间的空间关系来表示空间对象的能力。因此,近年来数据挖掘的研究己从关系型和事务型数据库扩展到空间数据库,即研究如何从空间数据库中去发现隐含的知识。 1.空间数据挖掘的定义和特点 所谓空间数据挖掘(SpatialDataMining,简称SDM)[1][2][3][4],或称从空间数据库中发现知识,是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征。 空间数据挖掘作为数据挖掘的一个重要分支,其数据结构和处理问题的方法等方面存在一些与数据挖掘的明显差异,形成了独有的特点。ShashiShekhar等[2]对空间数据挖掘和传统的数据挖掘进行了全面的比较,得出四个方面的差异: (1)空间数据的复杂性 空间数据包括用于描述空间对象的空间属性数据,这些数据包含空间对象位置信息以及空间对象之间拓扑关系、距离关系和方位关系等。同时,空间数据对象之间的关系比一般的关系数/doc/2dc83b7c27284b73f24250e7.html据库中的数据对象之间的关系要复杂得多、隐蔽得多,也使得空间数据挖掘的复杂性大大增强。传统的数据挖掘方法难以有效的处理和分析空间属性数据。 (2)统计学基础 统计分析的一个基本假设是数据样本的产生是独立的,但空间数据集中关于样本的独立性的假设却往往不能成立。实际上,空间数据的样本往往是自相关的,例如一个地区的经济发展水平和临近地区有相似。这种空间依赖关系的产生源于所研究对象的内在关系,忽视了这一特性的传统数据挖掘方法无法充分有效得发挥作用。 (3)可发现知识类型 与数据挖掘可发现广义型知识、分类型知识、关联型知识和预测 空间聚类和型知识相对应,空间数据挖掘发现的知识主要有四种:1、 空间离群点挖掘;3、空间关联规则;4、预测。分类;、 (4)算法过程 空间数据库存储的对象是大量的地理图形数据,而且空间数据库系统的数据结构和存取方法比一般的关系数据库系统更加复杂,这使得空间数据库系统的规模往往较大,因此运算效率问题尤为突出。另一方面,空间数据挖掘的算法处理的是空间对象,不可避免的要用到一些针对空间数据对象的操作,例如空间对象的联接、地图覆盖、最近邻查询等。因此,空间数据对象的访问方式和数据结构也是一个关键问题。 此外,空间数据挖掘的结果一般包含空间对象,往往是一些图形 因信息,它不同于通常的关系数据库中的结果,很难用文字表示清楚。 此空间数据挖掘的可视化也是一个很重要的问题。 中的实体,是一种在现实世界中不能再划分为同类现象的现象。例如一个城市可以看成一个地理实体,因为它可以划分为若干区域如区、街道等,但这些区域不能再被称为城市。 空间数据描述的信息包括两部分:一种是描述地理实体空间位置、几何形状以及实体之间空间关系的空间属性信息,另一种是描述地理实体其他属性的描述性信息。对应这两种信息,引入两个新的概念:空间谓词与非空间谓词[5]。 2.2空间数据模型 为了方便地理实体在空间数据库中的/doc/2dc83b7c27284b73f24250e7.html存储,必须先建立空间数据模型,即空间数据特征的抽象。数据模型分为三个层次:概念数据模型、逻辑数据模型和物理数据模型。 GIS中最常用的概念数据模型为矢量模型和栅格模型[6]: 线、面表达现实世界,点用空间坐标对表示,(1)矢量模型:用点、 线由一串坐标对

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档