数字城市大作业汇编.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
空间数据挖掘技术及聚类技术的现实应用 摘要 随着空间获取技术和计算机网络等技术的迅速发展,使得空间数据资源急剧膨胀,为了充分利用这些海量数据,并推动数字城市的发展。本文对空间数据挖掘与传统数据挖掘进行比较,并对空间数据挖掘的主要方法及特点进行了分析,总结出空间数据挖掘技术可包括空间分类和空间趋势预测、空间聚类、空间规则挖掘、空间离群点查找等。并举例说明空间聚类挖掘的应用。最后,对本文进行的总结。 关键字 空间数据挖掘 主要方法 算法 聚类分析的应用   一 引言 20世纪中后期,以计算机技术为代表的现代科学技术迅速发展,加快了世界信息化的进程。而信息社会的到来则极大地提高并加速了各个领域和部门生产、采集、管理、存储和处理各种数据信息的能力,而且这些数据每天都在高速增长,使得各种数据资源日益丰富. 虽然数据量在以惊人的速度与日俱增,但是人们真正从这些海量数据中获取的知识却是极其有限的,大量的数据资源闲置浪费。 数据库中隐含的丰富的知识没有得到充分的挖掘和利用,急剧增长的数据量远远超过了人们对它们的理解能力。 数据挖掘(也称为知识发现) 在数据和数据库急剧膨胀的背景下应运而生,它既是3S 集成中的一项关键技术,也是数字地球技术系统中的重要内容[1] 。 数据挖掘及后来兴起的空间数据挖掘的发展经历了几个阶段: 1991~ 1995 年, 研究数据挖掘主要是基于统计、决策树和规则抽取等技术;1996~1999 年, 统计、决策树和规则抽取技术已成为基本技术方法, 而Bayes网络、基于事例的推理技术已得到相当好的进展, 基于模糊集和Rough集的技术也开始得到应用; 这一阶段的另一个主要特点是多方法的集成;2000年后, 不仅模糊集和Rough 集技术得到了进一步的应用, 而且像支持向量机这样的新技术也颇受关注;由于Internet的发展, 基于Internet的数据挖掘和信息检索, 成为这一阶段的一个热点研究领域, 另外就是多媒体数据的挖掘也得到了研究者的重视。现代空间获取技术和计算机网络等技术的发展, 使得空间数据资源急剧膨胀。但海量的数据并没给人们以海量知识, 他们只是一些基本的原材料, 描述发生了什么事情却不能作为知识成为决策和行动的可靠基础,就是说数据没转变为知识被人充分利用起来。所以目前状况为信息过量,难以被人们所消化,于是产生了空间数据挖掘。 空间数据挖掘技术的产生与发展来自两大推动力[2]。 第一, 由于数据挖掘研究领域的不断拓展,由最初的关系数据和事务数据挖掘,发展到对空间数据的挖掘。空间数据库有着比一般关系数据库和事务数据库更加丰富和复杂的语义信息, 包含更丰富的知识。 第二,大量的数据通过传感器和其他数据采集设备源源不断地收集。随着数字城市实施,各种空间数据大量产生。海量的空间数据在某种意义上已超过了人们处理能力,传统的空间分析难以胜任从这些海量的数据中提取和发现空间知识。数据挖掘与知识发现的出现很好地满足了空间数据处理的需要,推动了数据挖掘技术在空间数据中的应用, 促使空间数据挖掘的产生与发展。 二 空间数据挖掘与传统数据挖掘的区别 空间数据挖掘(Spatial Data Mining,简称SDM),是从空间数据库中抽取隐含知识、空间关系或非显式地存储在空间数据库中的有实际意义的特征;它旨在使用计算机技术从大型空间数据库中发现未知的各种空间规律、关系、趋势等,从而有助于我们进行更好的科学决策。 空间数据挖掘有多种分类方法:从发现知识来划分,可以分为分类规则挖掘、特征规则挖掘、趋势分析等;从数据库的类型划分,可以分为关系型、事物型、面向对象型、空间型等;从采用的技术来划分,有规则归纳,粗糙集(Rough)方法、可视化技术等。 由于空间数据挖掘与传统数据挖掘在数据、数据的存储方式、查找模式上的不同,便决定了他们之间有以下的差异: ⑴数据的复杂性:前者比后者更加复杂。举例来说,空间数据包含扩展的对象如点、线、面等比一般关系数据库包含了更丰富的知识。空间数据包含了费空间和空间属性,非空间属性如地名、人口、温度、气压等;空间属性如经纬度、实体形状、空间方位等。 ⑵空间数据存在于连续的数据空间,与之相反的是传统的数据通常是离散的; ⑶空间模式是基于局部的,而传统的模式是基于全局的; ⑷空间关系如叠加、拓扑等是不明确的,传统数据关系是明确的,如逻辑关系; ⑸空间数据存在自相关,传统数据分析是基于数据采样是独立的; ⑹在存储与获取方面:空间对象用数据类型和空间关系表示;空间数据库常需空间推理、几何计算和空间知识来表示。这决定了空间数据挖掘比传统数据挖掘更复杂; ⑺空间数据具有多源、多维、时态性的特点,所获取的数据例如一个城市级的GIS系统,一般

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档