- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
空间数据库6
空间数据库(6) 陈斌 chenbin@ 2005.04.12 空间存储和索引 目标和基本思想 物理存储介质 缓冲区管理 存储组织 存取路径:索引结构 索引 索引:支持对于所要求的数据进行快速定位的附加的数据结构。 每个索引结构有一个特定的搜索码与之关联。 索引按一定的方式存储搜索码的值,并将搜索码与包含该搜索码的记录关联起来。 搜索码:用于在文件中查找记录的属性或属性集。 基本索引结构 顺序索引 索引基于对搜索码值的一种排序 散列索引 索引基于将搜索码值平均分布到若干散列桶(hash buckets)中 内外存索引优化策略不同 内存索引偏向减少空间需求,对速度不敏感 外存索引偏向减少访外次数,对速度敏感 基本索引结构:顺序索引 顺序索引中按照一定的顺序存储搜索码的值 主索引:若文件中的记录按照某个搜索码值的顺序来存储,则这个搜索码所对应的索引称作主索引,或者聚类索引(cluster index) 辅助索引:索引对应的搜索码值的顺序与文件记录的存储顺序不一致,也称作非聚集索引 基本索引结构:散列索引 在外存中按照桶散列,通过散列函数将搜索码值对应到桶地址 桶(bucket)是能存储一条或多条记录的一个存储单位,每个桶包括一个或多个磁盘块 散列牺牲存储效率 可以通过可扩充散列,在数据库大小变化时对桶进行分裂或合并,保持一定的空间效率 对索引技术评价的考虑 访问类型 能有效支持的数据库访问的类型; 访问时间 访问一个或多个数据项所需的时间; 插入时间 在索引中插入一个新数据项所需的时间; 删除时间 从索引中删除一个数据项所需的时间; 空间开销 索引结构所需的额外的存储空间。 聚类(cluster) 以某种搜索码值的顺序安排记录的物理存储 搜索码值相近的记录在存储上也相近 表现在磁道和扇区上的相邻 降低对于常见的大查询的响应时间 单搜索码值的查找,范围值的查找 降低寻道时间和寻扇区时间 提高磁盘缓存的命中率 聚类 简单数据类型的聚类 整数、定点数、浮点数 字符串、日期 具有完整的一维全序性质,其值可以排成线性单调序列,和存储器的线性性质相符 复杂数据类型的聚类 两维以上的简单数据类型的组合向量 如空间数据、多搜索码的结构 聚类 多维数据类型的聚类方法 将高维地址空间映射到一维地址空间 一一对应的映射,保证没有地址遗漏和重复 保持距离的映射,保证高维中相邻的地址也在一维中相邻 一一对应的映射容易构造 保持距离只能近似的实现 Z序映射和Hilbert曲线映射 二维空间聚类 考虑有限二维整数平面 以每次四分网格的形式递归划分平面 递归划分的层次决定坐标的二进制位数 每个网格具有唯一的二维坐标作为地址 Z序映射 Z序映射编码 读入x和y坐标的二进制表示; 隔行扫描二进制位到一个字符串; 计算出结果二进制串的十进制值。 Z序映射编码例子 Hilbert曲线映射 Hilbert曲线映射编码 读入x和y坐标的二进制表示; 隔行扫描二进制位到一个字符串; 将字符串从左到右分成若干2位长的串si(i=1..n),并将其换成规定的十进制数 00-0, 01-1, 10-3, 11-2 对十进制数进行替换 01-03, 03-01, 30-32, 32-30 再将十进制表示换成二进制表示,连接后计算十进制值,得到一维的地址 Hilbert曲线映射编码例子 聚类的磁盘访问性能 基本假定 有限范围的多维空间,有限个网格单元 映射将多维空间的单元指定一个整数地址 每个网格单元对应一个磁盘页面的存储 连续地址的单元存储在相邻磁盘页面 性能衡量指标 对一片连续空间范围网格的访问涉及尽量少间断的磁盘页面 聚类的磁盘访问性能 连续区域的聚类表示 具有多维坐标的单个网格单元可以通过映射编码直接得到聚类存储单元的地址,对应点查询的情形 一片连续区域的网格,对应范围查询的情形 某些连续区域包含的网格单元具有共同的编码前缀 任意的连续区域需要拆分成几片上述性质的区域 通常采用近似的方法减少拆分片数提高效率 连续区域的聚类表示 一维搜索码的索引 B树与B+树 多叉树,分支数量受到上下限的限制 平衡树,子树的层次差受到限制 区别 内部节点是否存储实际的搜索码值 是否允许顺序索引 一维搜索码的索引:B树 一维搜索码的索引:B+树 B+树的分支结点上关键码与指向子女的指针总是成对出现,仅记录子节点最大关键码,称为分界值关键码 多维索引 类似散列表的结构 网格文件 分段散列 基于树形的结构 四分树 R树 网格文件 通过对每个维的值进行排序,将搜索码值“散列”到桶中 结构 一个网格数组,其每个单元包含一个指向桶的指针,可以有多个单元指向同一个桶。 每个维一个线性标量,对该维的值进行划分。由线性标量确定一个多维搜索码值应该落到网格数组的哪一个单元中。 网格文件 网格文件 网格文件:
您可能关注的文档
- 我的母亲全国获奖课.ppt
- 六年级第一学期作文竞赛试题.doc
- 网页设计练习题集2011(答案).doc
- 识图题七年级下.doc
- 2012年成人招生宣传方案.doc
- 卧龙社区开展体育工作总结.doc
- 耐高温涂料技术鲜花绽放.doc
- (股票大讲堂)第160节暴涨回马枪.doc
- 2005年七年级数学第二学期单元练习(二).doc
- 后勤处主任职责.doc
- 实验室危废随意倾倒查处规范.ppt
- 实验室危废废液处理设施规范.ppt
- 实验室危废处置应急管理规范.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第20课时 中国的地理差异.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第21课时 北方地区.ppt
- 危险废物处置人员防护培训办法.ppt
- 危险废物处置隐患排查技术指南.ppt
- 2026部编版小学数学二年级下册期末综合学业能力测试试卷(3套含答案解析).docx
- 危险废物处置违法案例分析汇编.ppt
- 2026部编版小学数学一年级下册期末综合学业能力测试试卷3套精选(含答案解析).docx
最近下载
- 李群-李代数讲义.pdf VIP
- 【45吨天餐厨废弃物资源化利用和无害化处理扩建】项目建设项目环境影响报告表.doc VIP
- 北京市东城区2024-2025学年九年级上学期期末考试 数学试题(含解析).docx VIP
- PSX 610G 使用说明书.pdf VIP
- 2020_2021学年九年级化学下册第七单元常见的酸和碱第四节酸碱中和反应随堂练习新版鲁教版20210610129.docx VIP
- 超实用新高考复习:高考英语新课标新增词汇 (共100个) 清单.docx VIP
- 伯恩斯坦-大幅上调阳光电源目标价至260.pdf VIP
- 新疆若羌县东南部遥感地质特征及成矿条件分析.pdf VIP
- 沪教版道法题库及答案.doc VIP
- (新版)C+Python基础知识考试题库(核心500题).docx VIP
原创力文档


文档评论(0)