- 1、本文档共101页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 空间数据挖掘 第十章 目录 10.1空间数据挖掘简介 10.2空间关联规则挖掘 10.3空间co-location模式挖掘 10.4本章小结 引言 近年来,随着数据处理工具、先进数据库技术以及万维网(WWW)技术的不断成熟和数据应用的普及,数据库不论是数量、单个数据库的容量,还是数据类型的复杂程度都大幅度地增加了。因此,传统数据挖掘面临着一个重要的课题就是针对复杂类型数据的挖掘。正是基于这个原因,作为数据挖掘技术的一个延伸发展,空间数据挖掘应运而生。 10.1 空间数据挖掘简介 10.1.1 空间数据挖掘的产生 10.1.2 空间数据的特点 10.1.3 空间数据挖掘的过程 10.1.4 空间数据挖掘的分类 10.1 空间数据挖掘简介 空间数据挖掘是指对空间数据库中非显式存在的知识、空间关系或其他有意义的模式等的提取。空间数据挖掘需要综合数据挖掘与空间数据库技术。空间数据挖掘不仅在地理信息系统、地理市场、遥感、图像数据勘测、医学图像处理、导航、交通控制、环境研究等领域有着广泛的应用,空间数据挖掘还可以用于对空间数据的理解、空间关系和空间与非空间数据关系的发现、空间知识库的构造、空间数据库的重组和空间查询的优化。 10.1.1 空间数据挖掘的产生(1) 空间数据挖掘技术的产生来自于两个方面的推动力: 首先,由于数据挖掘研究领域的不断拓展,由最初的关系数据和事务数据的挖掘,发展到对空间数据库的挖掘。空间信息正在逐步成为各种信息系统的主体和基础。空间数据是一类重要、特殊的数据,它有着比一般关系数据库和事务数据库更加丰富和复杂的语义信息,包含着更丰富的知识。因此,尽管数据挖掘最初产生于关系数据库和事务数据库,但由于空间数据的特殊性,从空间数据库中挖掘知识很快引起了数据挖掘工作者的关注。许多数据挖掘方面的研究工作也从关系型和事务型数据库扩展到空间数据库。 10.1.1 空间数据挖掘的产生(2) 其次,在地学领域,随着卫星和遥感技术的广泛应用,日益丰富的空间数据和非空间数据收集和存储在空间数据库中,海量的地理数据在一定程度上已经超过了人们的处理能力,同时传统的地学分析难以胜任从这些海量数据中提取和发现地学知识。这给当前GIS技术提出了巨大的挑战,迫切需要增强GIS分析功能,提高GIS解决地学实际问题的能力。数据挖掘与知识发现的出现很好的满足了地球空间数据处理的需要,推动了传统地学空间分析的发展。根据地学空间数据的特点,将数据挖掘方法引入GIS,形成地学空间数据挖掘与知识发现的新型地学数据分析理论。 10.1.2 空间数据的特点(1) 空间数据是指用来记录空间实体的位置、 形状、 大小、 空间分布特征、 相互关系以及质量数量等信息的数据, 不仅需要描述空间实体的常规属性信息和空间几何信息, 同时还要记录空间实体之间的关系, 包括空间拓扑关系, 方位关系和距离关系。 与普通数据相比, 空间数据更加复杂, 其主要有如下的特点: 10.1.2 空间数据的特点(2) 1) 海量性。一方面, 各种空间数据获取技术的进步, 使得可用空间数据总量呈几何量级不断增长。另一方面, 由于空间数据需要记录的内容多且复杂, 单个实体信息存储空间相对普通数据也较大。 因此, 基于海量空间数据的挖掘, 不但要考虑算法的可行性, 而且还要考虑算法的效率。传统的非空间挖掘算法必须进行改进以满足在海量空间数据中进行挖掘的要求。 10.1.2 空间数据的特点(3) 2) 多维性。空间数据记录空间实体的空间、 非空间、 空间与空间、 空间与非空间、 非空间与非空间属性之间的关系, 每个方面又由多个属性维构成, 故空间数据的维数很高。在进行空间数据挖掘时, 如何在如此复杂维度的数据中进行取舍, 并进行高效的知识获取, 是一个很有意义的研究方向。 3) 多尺度。尺度是空间数据一个固有的特性, 又是其复杂性的一种体现。空间数据在不同观察层次上所遵循的规律以及体现出的特征不尽相同。 在进行挖掘时, 可以利用不同尺度层次之间的渐变关系, 来进行同尺度、 跨尺度的挖掘及由已知尺度下的挖掘结果推导其它尺度下的知识。 10.1.2 空间数据的特点(4) 4) 不确定性。传统空间数据分析中, 空间实体的几何边界或定性属性都视为刚性。在现实世界中, 空间实体的边界却是柔性的, 而且不同实体边界弹性大小各异。空间数据的柔性边界使得在进行相应的空间数据挖掘时, 不同抽象层次空间和非空间关系计算具有了不确定性。 如何在空间数据中表达这种柔性边界, 如何计算具有不确定性的空间实体间的关系是空间数据挖掘的一个重要的研究内容。 10.1.2 空间数据的特点(5) 5) 相关性。传统数据在统计上是相互独立的。空间实体分布于一定的空间区域内, 相互之间存在着某种关
您可能关注的文档
- 自动化生产线安装与调试 作者 何用辉项目4 任务三 PPI通信实现自动化生产线联机调试.ppt
- 自动化生产线安装与调试 作者 何用辉项目4 任务一 自动化生产线机械结构调整知识与能力目标.ppt
- 自动检测技术实用教程 作者 周征 第4章 流量传感器.ppt
- 自动控制技术项目教程 作者 贺力克 第7章直流调速系统.ppt
- 自动控制原理 第3版 作者 孙炳达 第1章.ppt
- 自动控制原理 上 作者 谢昭莉 第4章.ppt
- 自动控制原理 作者 孟华 第5章.ppt
- 自动控制原理 作者 孟华 第7章.ppt
- 自动控制原理 作者 张冬妍 第4章 线性控制系统的根轨迹分析法.ppt
- 走进物流 作者 毛宁莉 项目二.ppt
- 绿电2022年系列报告之一:业绩利空释放,改革推动业绩反转和确定成长.docx
- 化学化工行业数字化转型ERP项目企业信息化规划实施方案.pdf
- 【研报】三部门绿电交易政策解读:溢价等额冲抵补贴,绿电交易规模有望提升---国海证券.docx
- 中国债券市场的未来.pdf
- 绿电制绿氢:实现“双碳”目标的有力武器-华创证券.docx
- 【深度分析】浅析绿证、配额制和碳交易市场对电力行业影响-长城证券.docx
- 绿电:景气度+集中度+盈利性均提升,资源获取和运营管理是核心壁垒.docx
- 节电产业与绿电应用年度报告(2022年版)摘要版--节能协会.docx
- 2024年中国人工智能系列白皮书-智能系统工程.pdf
- 如何进行行业研究 ——以幼教产业为例.pdf
文档评论(0)