空间存储和索引.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
空间存储和索引本章要了解的几个问题第1页/共47页数据库的索引可以用来快速访问一条特定查询所请求的数据,无需遍历整个数据库。一般都用高级逻辑语言书写的。空间存储结构的目标是方便空间选取和连接查询。 物理数据库设计目标就是让数据传输量保持为一个绝对最小值。 空间查询过程的基本思想就是对近似的使用。使用近似可以产生一种用于过滤和精炼查询过程的策略。可以让索引结构按照一个或多个空间码来管理对象,这些空间码是比对象本身更简单的几何对象。 近似能解决的与空间索引相关的操作第2页/共47页 近似这样的结构提供了插入,删除和成员查询等操作,用于管理空间类型的集合。可支持一个或多个查询操作。对于所存储的矩形和点,有一些重要操作:点查询:找出所有包含给定点的矩形 范围查询:找出所有位于给定矩形中的点 最近邻居:找出距查询点最近的点 距离扫描:按与给定点距离的增序列出所有点 相交查询:找出所有与给定矩形相交的矩形 包含查询:找出所有完全包含在给定矩形中的矩形 空间连接查询:找出所有相互交叠的矩形对 目录4.1存储:磁盘和文件第3页/共47页CPU访问主存的速度是非常快的(纳秒级)。对二级存储的访问速度相对来说很慢(微秒级),一个严重的瓶颈 。对于空间数据库来说,更加复杂:空间应用涉及的函数其计算复杂性与程序设计语言的应用程序不相上下。空间数据库的存储需求一般来说要比传统数据库更高。数据可能会溢出到三级存储中。4.1.1 磁盘的几何结构和含义第4页/共47页基本名词:磁道 柱面 扇区 磁盘块 从磁盘读取数据到主存,整个过程可以分为三步,每一步都有一个特征时间:寻道时间(ts)延迟时间(tl)传输时间(tt)全部存取时间(ta)计算:ta=ts+tl+tt且通常满足下面不等式:tstltt4.1.2 缓冲区管理器第5页/共47页缓冲区管理器是DBMS中一个软件模块,专门负责管理主存与二级存储之间的数据传输,确保事务不会因为一部分数据不在主存中而停顿下来。置换策略是缓冲区管理器所实施的协议。如最近最少使用(LRU)算法 频繁访问集一组被频繁访问的页面。DBMIN算法第6页/共47页DBMIN算法是以查询本地集模型(QLSM)为基础的。将数据库操作的引用模式特征化为顺序引用、随机引用和分层引用。 和一个文件实例关联的缓冲页面集合被看作是它的本地集(local set) ,有一个全局页表和全局空闲链表来管理。 如果在本地集和全局页表中找到了所请求的页面,有找到这一页就直接返回这一页,同时更新该页的使用情况统计信息。如果没,则把该页读入本地集合(一个空页)中。如果没有可用的空页(例如,本地集的大小超过了最大阀值),就要根据本地集所指定的页面置换规则,替换一个已经存在的页面。 4.1.3 域、记录和文件第7页/共47页基本名词:文件 记录域二进制大对象(BLOB)域类型 第8页/共47页 二进制大对象(BLOB)域类型在空间数据库的发展中起了重要作用。BLOB的缺点:BLOB域在技术上还不能算作一种数据类型;RDBMS将一个BLOB视作没有任何结构的无格式数据;BLOB域上没有可用的查询操作。 4.1.4 文件结构第9页/共47页文件结构指文件中记录的组织形式。1.无序文件最简单的组织形式,记录没有特定的顺序。缺点:根据给定的关键码查找一条记录需要扫描文件中的记录。优点:是在进行插入操作时可以很容易地在文件末尾插入一条新记录。2.散列文件第10页/共47页 散列文件组织使用散列函数把记录分到一系列散列单元中。它能够把数量大致相同的记录放人每个散列单元中。优点:对于点的查询、插入和删除操作非常有效,选择适当的散列函数来组织文件,可以在一个常数时间(例如两次磁盘访问)内完成查询,面与文件中记录的个数无关。缺点:散列文件组织方式并不适合范围查询。散列文件组织方式示例第11页/共47页3.有序文件第12页/共47页根据给定的主码域对记录进行组织。 优点:可使用折半查找算法查找记录,能够进行范围查询。缺点:有序文件组织方式不能直接应用在空间领域。有序文件组织示例第13页/共47页4.1.5 聚类第14页/共47页聚类的目的:就是降低响应常见的大查询的寻道时间(ts)和等待时间(tl)。SDBMS可以支持三种聚类,用于提供有效的查询处理:内部聚类(internal clustering):为了加快对单个对象的访问,一个对象的全部表示都存放在同一个磁盘页面中,这里假设它小于页面的空闲空间;否则,这个对象就要存储在多个物理上连续的页面中。 本地聚类(local clustering):为了加快对多个对象访问的速度,一组空间对象(或者近似)被分组到同一页面。 全局聚类(global clustering):与本地聚类相反,一组空间邻接的对象并不存储在一个而是多个物

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档