第5章 空间索引与优化.pptVIP

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 空间索引与优化

第五章 空间索引与查询优化 2013.4 第五章 空间索引与查询优化 第一节 空间索引 第二节 空间查询优化 一部工具书好比是一个微型数据库;工具书的索引,就好比进入它的数据库的钥匙。 定义 索引: 索引是一种独立的对象,用来快速地寻找那些具有特定值的记录 索引要占用存储空间 索引可以减少全表扫描,从而提高检索速度 例如:学生信息表student如下: 查询005号学生的信息: SELECT * FROM student WHERE 学号=‘005’ 例如:查找经过河南省的所有河流。 常规方法:检查所有河流和河南省省界是否相交。 缺点:用实际空间对象比较,算法复杂,计算开销大、IO开销大。 索引方法:记录河流和省界的外接矩形。用外接矩形进行比较。 定义 空间索引: 空间索引就是指依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。 空间索引的基本思想,也是空间查询的基本思想,即近似体的使用。 让索引结构按照一个或多个空间码来管理对象,这些空间码是比对象本事更简单的几何对象。 常见的空间索引: 对象范围索引 格网索引 四叉树索引 R树和R+树索引 BSP树索引 一、对象范围索引 在记录每个空间实体的坐标时,记录包围每个空间实体的外接矩形的最大最小坐标。 在检索空间实体时,根据空间实体的最大最小范围,预先排除那些没有落入检索窗口内的空间实体,仅对那些外接矩形落在检索窗口的空间实体作进一步的判断,真正落入窗口内的空间实体。 对象范围索引 这种方法没有创建真正的空间索引文件,而是在空间对象的数据文件中增加了矩形范围,主要依靠空间计算进行判别。 查询时仍需要对整个数据文件的空间对象进行检索,只是某些对象可以通过矩形范围予以直接判别,而有些对象仍需要进行复杂计算才能判别。 虽然该方法仍需要花费大量时间来进行空间检索,但随着计算机的处理速度的加快,这种方法在一定程度上能够满足查询检索的效率要求 对象范围索引 在进行空间范围查询时,分为两级过滤(筛选): 初次过滤根据空间要素外包络矩形来过滤掉大部分不在查询范围的空间要素; 第二级过滤则用查询空间范围直接和初次过滤结果集中空间要素的二进制边界坐标比较,从而得到查询的准确结果。 二、格网索引 将研究区域用横竖线条划分大小相等和不等的格网,记录每一个格网所包含的空间实体 用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体 通常是把整个数据库数值空间划分成32×32(或64×64)的正方形网格,建立另一个倒排文件——栅格索引。 每一个网格在栅格索引中有一个索引条目(记录),在这个记录中登记所有位于或穿过该网格的物体的关键字。 检索原理: 第一阶段(RDBMS完成): 接收SQL语句,获取空间过滤器的封装边界 检测空间过滤器的封装边界跨越的网格 到空间索引表中检索出封装边界所在网格内的要素 第二阶段: 几何过滤器的封装边界与第一阶段检索出的要素的边界相比较,找出具有重叠关系的要素 第三阶段 几何过滤器的坐标与第二阶段检索出的要素的边界比较,找出边界在几何过滤器内的要素 第四阶段: 几何过滤器的坐标与第三阶段检索出的要素的比较,找出最终在几何过滤器内的要素类 按格网法对空间数据进行索引时,所划分的格网数不能太多,否则,索引表本身太大而不利于数据的索引和检索  三、四叉树索引 二维空间范围被划分为一系列大小相等的棋盘状矩形,即将地理空间的长和宽在X和Y方向上进行2N等分,形成2N×2N的网格,并以此建立N级四叉树。 四叉树是具有一个根节点,其中的每个中间节点都有四个孩子。四叉树的每个节点对应一个正方形。 在建立四叉树索引时,根据所有空间对象覆盖的范围,进行四叉树分割,使每个子块中包含单个实体,然后根据包含每个实体的子块层数或子块大小,建立相应的索引。 在四叉树索引中,大区域空间实体更靠近树的根部,小实体位于叶端,以不同的分辨率来描述不同实体的可检索性 第一阶段(RDBMS完成): 接收SQL语句,获取空间过滤器的封装边界 将空间索引四等分,每一份与空间过滤器的封装边界的边界比较,取出与空间过滤器的封装边界没有重叠的网格(这些网格不再分) 将得到的部分继续四等分,与空间过滤器的封装边界的边界比较。 第二阶段: 几何过滤器的封装边界与第一阶段检索出的要素的边界相比较,找出具有重叠关系的要素 第三阶段 几何过滤器的坐标与第二阶段检索出的要素的边界比较,找出边界在几何过滤器内的要素 第四阶段: 几何过滤器的坐标与第三阶段检索出的要素的比较,找出最终在几何过滤器内的要素类 四、BSP树索引 BSP树(Bi

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档