面向服务空间数据挖掘体系结构研究.pdfVIP

面向服务空间数据挖掘体系结构研究.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向服务的空间数据挖掘体系结构研究 1,2 1 2 胡斌 ,陈正阳 ,刘鹏 1 中南大学测绘与国土信息工程系,湖南长沙(410083 ) 2 中国人民解放军理工大学军事网格研究中心,江苏南京(210007 ) E-mail :hubing988ok@163.com 摘 要:随着对地观测手段、空间数据获取方式以及计算机技术的迅速发展,使得各种地理 空间数据资源日益丰富,但是,这些数据资源中所蕴涵的知识还远远没有得到充分的发现和 利用。把新兴的网格技术与空间数据挖掘技术相结合,能有效解决计算资源短缺的瓶颈问题, 从而为分布式空间数据库中知识的发现和利用提供了良好的支撑。本文重点对网格环境下的 空间数据挖掘体系结构基本特征进行了分析,并在此基础上给出了数据访问和中介服务以及 空间数据挖掘服务的实现方式。 关键词:网格技术;空间数据挖掘;数据访问服务;数据中介服务;数据挖掘服务 随着对地观测手段、空间数据获取方式、计算机技术、网络技术以及空间数据库技术的 迅速发展,使得各种地理空间数据资源日益丰富,但是,这些数据资源中所蕴涵的知识还远远 没有得到充分的发现和利用,致使“数据爆炸但知识贫乏”[1] 。同时,要求终端用户详细分析这 些空间数据,并提取感兴趣的知识或特征是不现实的。因此,从空间数据库中自动地挖掘知识, 寻找隐藏在空间数据库中不明确的、隐含的知识、空间关系或其他模式, 即空间数据挖掘 ( Spatial Data Mining,SDM) ,变得越来越重要。 SDM是在空间数据库的基础上,综合利用统计学方法、模式识别技术、人工智能方法、 神经网络技术、模糊数学、机器学习、专家系统和相关信息技术等,从大量的空间生产数据、 管理数据、经营数据或遥感数据中析取人们可信的、新颖的、感兴趣的、隐藏的、事先未知 的、潜在有用的和最终可理解的知识,从而揭示出蕴含在数据背后的客观世界的本质规律、 内在联系和发展趋势,实现知识的自动获取, 主要包括普遍的几何知识、空间关联规则、空间 模式与特征、空间分类规则、空间聚类规则以及空间数据与非空间数据之间的概要关系等知 [2-3] 识 。 1. 相关背景知识 1.1 空间数据的特点 SDM的对象是空间数据库或空间数据仓库,它们既存储了空间实体的位置和属性等数据, 也拥有空间实体之间的空间关系(不仅多了拓扑关系、方位关系,而且度量关系还与空间位置 和对象间的距离有关),其存储结构、查询方式、数据分析和数据库操作等都有别于常规的事 务型数据库。因此空间数据之间的关系更为复杂,与其他类型的数据之间存在明显的差异。 归纳起来,空间数据具有如下复杂性特点[1,4 - 7 ] : (1) 具有尺度特征。空间数据在不同 观察层次遵循的规律以及体现出的特征不尽相同。在尺度维上,表达了空间数据由细至粗多 比例尺或多分辨率的几何变换过程。尺度越小(即比例尺越大) ,对空间目标表达越精细、越 微观;尺度越大(即比例尺越小) ,对空间目标表达越概括、越宏观,利用该性质可以探究空间 信息在泛化和细化过程中所反映出的特征渐变规律。 (2)数据海量,分布式存储。分布在不 同地理位置的海量空间数据常使一些算法因难度和效率或计算量过大而无法实施,因此SDM 的任务之一就是要发展新的计算模式并研究新的高效算法,克服因海量数据的分布式存储所 造成的技术困难。(3) 空间属性之间的非线性关系。它是空间数据库系统复杂性的重要标 -1- 志,反映了系统内部相互作用的复杂关系和机制。(4) 空间维数的增加和数据类型复杂。地 理空间对象的属性增加极为迅速,如在遥感领域, 由于传感器技术的飞速发展,波段的数目由 几个增加到几十甚至上百个,如何从几十甚至几百维空间中挖掘数据、发现知识成为研究中 的又一热点。(5) 空间信息的模糊性和不确定性。模糊性与不确定性几乎存在于各种类型 的空间数据中,如空间位置的不确定性、空间对象间关系的模糊性以及模糊

文档评论(0)

wq640326 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档