5空间存储和索引.pptVIP

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R树 搜索性能 MBR非交叠 MBR交叠 给定一点(x,y),查找点选polygon。 (x,y) ∈ MBR1 OR (x,y) ∈ MBR2 因为交叠 (x,y) ∈ MBR11 OR (x,y) ∈ MBR12 因为交叠 R+树 所有MBR不相交,但对象可以属于多个MBR ID1 x1 y1 x2 y2 ID2 ID2 x1 y1 x2 y2 P * 数据存储组织 文件中记录的组织 关系中的各个记录存放在文件中的什么位置 堆文件组织:记录没有顺序,一条记录可以放在文件中的任何地方。 散列文件组织:散列函数的计算结果确定记录应存储到文件的哪个块中。 顺序文件组织:记录根据搜索码的值顺序存储 数据字典的存储 数据字典:数据库的描述信息 关系模式信息:逻辑结构 关系存储信息:物理结构 用户信息:安全控制 统计信息:数量/容量统计 索引信息…… RDBMS中,数据字典和普通关系同样存储 索 引 索引:支持对于所要求的数据进行快速定位的附加的数据结构。 每个索引结构有一个特定的搜索码与之关联。 索引按一定的方式存储搜索码的值,并将搜索码与包含该搜索码的记录关联起来。 搜索码:用于在文件中查找记录的属性或属性集。 学号 记录起始地址 基本索引结构 顺序索引 索引基于对搜索码值的一种排序 散列索引 索引基于将搜索码值平均分布到若干散列桶(hash buckets)中 内外存索引优化策略不同 内存索引偏向减少存储空间需求,对速度不敏感 外存索引偏向减少访问次数,对速度敏感 基本索引结构:顺序索引 顺序索引中按照一定的顺序存储搜索码的值 主索引:若文件中的记录按照某个搜索码值的顺序来存储,则这个搜索码所对应的索引称作主索引,或者聚类(聚集、聚簇)索引(cluster index) 辅助索引:索引对应的搜索码值的顺序与文件记录的存储顺序不一致,也称作非聚集索引 基本索引结构:散列索引 在外存中按照桶散列,通过散列函数将搜索码值对应到桶地址 桶(bucket)是能存储一条或多条记录的一个存储单位,每个桶包括一个或多个磁盘块 散列牺牲存储效率 可以通过可扩充散列,在数据库大小变化时对桶进行分裂或合并,保持一定的空间效率 对索引技术评价的考虑 访问类型 能有效支持数据库访问的类型; 访问时间 访问一个或多个数据项所需的时间; 插入时间 在索引中插入一个新数据项所需的时间; 删除时间 从索引中删除一个数据项所需的时间; 空间开销 索引结构所需的额外的存储空间。 聚类/聚集(cluster) 以某种搜索码值的顺序安排记录的物理存储 搜索码值相近的记录在存储上也相近,表现在磁道和扇区上的相邻 降低对于常见的大查询的响应时间 单搜索码值的查找,范围值的查找 降低寻道时间和寻扇区时间 提高磁盘缓存的命中率 聚类/聚集(cluster) 简单数据类型的聚类 整数、定点数(Numeric(6,2))、浮点数(Float)、字符串、日期 具有完整的一维全序性质,其值可以排成线性单调序列,和存储器的线性性质相符 复杂数据类型的聚类 两维以上的简单数据类型的组合向量 如空间数据、多搜索码的结构 聚类/聚集(cluster) 多维数据类型的聚类方法 将高维地址空间映射到一维地址空间 一一对应的映射,保证没有地址遗漏和重复 保持距离的映射,保证高维中相邻的地址也在一维中相邻 一一对应的映射容易构造 保持距离只能近似的实现 Z序映射和Hilbert曲线映射 二维空间聚类 考虑有限二维整数平面 以每次四分网格的形式递归划分平面 递归划分的层次决定坐标的二进制位数 每个网格具有唯一的二维坐标作为地址 00 00 01 10 11 01 10 11 y x 两次递归划分的网格,可以多次递归划分网格 Z序映射 Z序映射编码 读入x和y坐标的二进制表示; 隔行扫描二进制位到一个字符串; 计算出结果二进制串的十进制值。 Z序映射编码例子 Hilbert曲线映射 Hilbert曲线映射编码 读入x和y坐标的二进制表示; 隔行扫描二进制位到一个字符串; 将字符串从左到右分成若干2位长的串si(i=1..n),并将其换成规定的十进制数,如: 00→0, 01→1, 10→3, 11→2 对十进制数进行替换 对与数组中第1位数字j: 若j =0,则第2位数字1→3, 3→1 若j =3,则第2位数字0→2, 2→0 自左至右,自上至下的顺序连接所有串,计算十进制值,得到一维的地址 Hilbert曲线映射编码例子 聚类的磁盘访问性能 基本假定 有限范围的多维空间,有限个网格单元 映射将多维空间的单元指定一个整数地址 每个网格单元对应一个磁盘页面的存储 连续地址的单元存储在相邻磁盘页面 性能衡量指标 对一片连续

您可能关注的文档

文档评论(0)

peain + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档