时空索引技术分享.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时空索引技术分享 各位前辈、朋友们大家好!我叫王德浩,目前是武汉大学测绘遥感信息工程国家重点实 验室的硕士一枚,也是咱们攻城狮群里普通的一员。由于我的研究方向比较偏空间信息处理, 所以可能大家平时了解不多,那我在这里就跟大家分享一些关于我目前的研究内容——时空 索引技术的相关知识,由于是研究内容,所以更偏学术一些。欢迎大家指正、讨论。我的微 信号是:w262730936. 本文介绍的内容的顺序为:背景介绍、空间索引、时空轨迹数据索引技术以及我自己的 研究。其中背景介绍简单说明了一下索引、空间数据、空间数据库和空间查询的概念。空间 索引简单介绍了一下两种常用的空间索引技术:R-tree和四叉树。然后介绍了最近兴起的时 空轨迹索引技术,最后介绍了一下自己的研究内容。 1.背景介绍 首先简单介绍一下背景吧,我们知道目前所有主流的数据库为了提高数据查询的速度, 都提供了索引功能,常见的有B/B+tree索引、位图索引等。索引通常通过建立冗余的数据 结构,以快速定位数据来加快查询过程。但与此同时为了维护索引,用户插入和更新数据的 时间肯定会延长。显然对于体量非常大的数据,建立索引是很有必要的。 接下来简单介绍一下空间数据,空间数据分为两种:栅格数据和矢量数据。栅格数据本 质上就是影像,通俗的理解就是分辨率特别高的照片 (可见光、红外、微波等波段),这些 影像可以通过遥感卫星、航空航天摄影测量,甚至无人机上加个单反 (或其它传感器)都可 以拍摄。栅格数据一般是以文件的形式保存,不在我们的讨论范围,我来重点介绍一下矢量 数据。矢量数据说白了就是坐标信息,二维矢量数据基本分为点、线、面以及它们的组合, 几乎所有的空间地物都能被抽象为这几种类型之一,如公路可以抽象为线,建筑物可以抽象 为面。后文提到的空间数据,均默认为矢量数据。以一个简单的线和面为例,它们计算机上 是以坐标序列存储的: 一般的数据库只为一维数据提供索引,数据库但也有好几家提供了二维甚至更高维空间 数据的存储与索引,我们也称之为空间数据库,其中功能最强大的莫过于Oracle,其能够为 空间数据提供R-tree和Quad-tree (四叉树)索引,并支持大量的空间查询与分析。其它一 些数据库如PostgreSQL、MySQL、MongoDB均或多或少支持空间数据存储与查询。 空间索引建立的目的是加快空间查询,空间查询主要包括范围查询、邻近查询等。范围 查询是给定空间范围 (矩形、圆形或任意多边形),查询落在此范围的地物,如:查询北京 范围(多边形)内一共有多少条公路。邻近查询则给定一个点,查询其附近n米内的地物, 如我们用大众点评搜索附近1km内的美食店。 2.空间索引简介 在空间数据存储领域,R-tree可以说是应用最为广泛的空间索引,可以说它是B-tree 的 二维版。在介绍它之前,必须先介绍一个重要的概念:最小外包矩形(MBR,MinimumBounding Rectangle),又称包围图元,是包围地物的,且平行于x,y轴的最小外接矩形。如下图所示: 介绍它的原因在于R-tree均是针对空间数据的MBR建立索引的,下面给出一个R-tree 的例子,图中的Rn均为MBR。 根据上层的划分,其树形结构如下图,一般来讲叶子节点的的MBR均对应一个地物。 R-tree能够动态的维护高度平衡,具有较高的查询效率,目前应用及其广泛,其具体的 构建、维护平衡的算法在网上有很多开源的代码,有兴趣的同志可以搜一下。那么R-tree 索引是如何加快查询的呢?我仍以上面的图为例进行解释。给出查询范围为图中的蓝色矩 形。 从根节点开始,蓝色框与R1、R2均相交。到树的第二层,计算可知蓝色框与R1中的R5相 交,与R2的R7相交。到树的第三层,蓝色框与R5的R13、R14相交,与R7的R17相交。 最后再判断蓝色框与R13、R14、R17所包含的地物是否相交,将相交的地物返回给用户。 这个过程避免了数据遍历,大大加快了查询速度。 另外,在空间数据领域,四叉树也是常用的索引结构,但它比R-tree简单多了,这里就 不过过多解释了,给个图大家应该就明白了: 3.时空轨迹数据索引技术 随着空间信息获取技术和通信技术的快速发展,GPS功能已经集成到诸多移动设备上 (如手机、汽车),基于位置的服务也因此蓬勃发展 (如社交、导航、团购)。移动对象的轨 迹很容易被大量记录下来,这些轨迹数据往往包含空间、时间、甚至语义信息,这些轨迹数 据在交通管理、数据挖掘等领域都

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档