- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R树 搜索性能 MBR非交叠 MBR交叠 给定一点(x,y),查找点选polygon。 (x,y) ∈ MBR1 OR (x,y) ∈ MBR2 因为交叠 (x,y) ∈ MBR11 OR (x,y) ∈ MBR12 因为交叠 R+树 所有MBR不相交,但对象可以属于多个MBR ID1 x1 y1 x2 y2 ID2 ID2 x1 y1 x2 y2 P * 数据存储组织 文件中记录的组织 关系中的各个记录存放在文件中的什么位置 堆文件组织:记录没有顺序,一条记录可以放在文件中的任何地方。 散列文件组织:散列函数的计算结果确定记录应存储到文件的哪个块中。 顺序文件组织:记录根据搜索码的值顺序存储 数据字典的存储 数据字典:数据库的描述信息 关系模式信息:逻辑结构 关系存储信息:物理结构 用户信息:安全控制 统计信息:数量/容量统计 索引信息…… RDBMS中,数据字典和普通关系同样存储 索 引 索引:支持对于所要求的数据进行快速定位的附加的数据结构。 每个索引结构有一个特定的搜索码与之关联。 索引按一定的方式存储搜索码的值,并将搜索码与包含该搜索码的记录关联起来。 搜索码:用于在文件中查找记录的属性或属性集。 学号 记录起始地址 基本索引结构 顺序索引 索引基于对搜索码值的一种排序 散列索引 索引基于将搜索码值平均分布到若干散列桶(hash buckets)中 内外存索引优化策略不同 内存索引偏向减少存储空间需求,对速度不敏感 外存索引偏向减少访问次数,对速度敏感 基本索引结构:顺序索引 顺序索引中按照一定的顺序存储搜索码的值 主索引:若文件中的记录按照某个搜索码值的顺序来存储,则这个搜索码所对应的索引称作主索引,或者聚类(聚集、聚簇)索引(cluster index) 辅助索引:索引对应的搜索码值的顺序与文件记录的存储顺序不一致,也称作非聚集索引 基本索引结构:散列索引 在外存中按照桶散列,通过散列函数将搜索码值对应到桶地址 桶(bucket)是能存储一条或多条记录的一个存储单位,每个桶包括一个或多个磁盘块 散列牺牲存储效率 可以通过可扩充散列,在数据库大小变化时对桶进行分裂或合并,保持一定的空间效率 对索引技术评价的考虑 访问类型 能有效支持数据库访问的类型; 访问时间 访问一个或多个数据项所需的时间; 插入时间 在索引中插入一个新数据项所需的时间; 删除时间 从索引中删除一个数据项所需的时间; 空间开销 索引结构所需的额外的存储空间。 聚类/聚集(cluster) 以某种搜索码值的顺序安排记录的物理存储 搜索码值相近的记录在存储上也相近,表现在磁道和扇区上的相邻 降低对于常见的大查询的响应时间 单搜索码值的查找,范围值的查找 降低寻道时间和寻扇区时间 提高磁盘缓存的命中率 聚类/聚集(cluster) 简单数据类型的聚类 整数、定点数(Numeric(6,2))、浮点数(Float)、字符串、日期 具有完整的一维全序性质,其值可以排成线性单调序列,和存储器的线性性质相符 复杂数据类型的聚类 两维以上的简单数据类型的组合向量 如空间数据、多搜索码的结构 聚类/聚集(cluster) 多维数据类型的聚类方法 将高维地址空间映射到一维地址空间 一一对应的映射,保证没有地址遗漏和重复 保持距离的映射,保证高维中相邻的地址也在一维中相邻 一一对应的映射容易构造 保持距离只能近似的实现 Z序映射和Hilbert曲线映射 二维空间聚类 考虑有限二维整数平面 以每次四分网格的形式递归划分平面 递归划分的层次决定坐标的二进制位数 每个网格具有唯一的二维坐标作为地址 00 00 01 10 11 01 10 11 y x 两次递归划分的网格,可以多次递归划分网格 Z序映射 Z序映射编码 读入x和y坐标的二进制表示; 隔行扫描二进制位到一个字符串; 计算出结果二进制串的十进制值。 Z序映射编码例子 Hilbert曲线映射 Hilbert曲线映射编码 读入x和y坐标的二进制表示; 隔行扫描二进制位到一个字符串; 将字符串从左到右分成若干2位长的串si(i=1..n),并将其换成规定的十进制数,如: 00→0, 01→1, 10→3, 11→2 对十进制数进行替换 对与数组中第1位数字j: 若j =0,则第2位数字1→3, 3→1 若j =3,则第2位数字0→2, 2→0 自左至右,自上至下的顺序连接所有串,计算十进制值,得到一维的地址 Hilbert曲线映射编码例子 聚类的磁盘访问性能 基本假定 有限范围的多维空间,有限个网格单元 映射将多维空间的单元指定一个整数地址 每个网格单元对应一个磁盘页面的存储 连续地址的单元存储在相邻磁盘页面 性能衡量指标 对一片连续
您可能关注的文档
- 2生存分析.ppt
- 2第5章第1节《降低化学反应活化能的酶》.pptx
- 231储蓄存款和商业银行课件.ppt
- 原发性胆汁性肝硬化的治疗进展.doc
- 33细胞器.ppt
- 原发性骨质疏松症诊治指南(2011年)吴美娟(免费阅读).ppt
- 原发性骨质疏松症的临床诊疗19209.12(免费阅读).ppt
- 原因与结果的法则([英]詹姆斯.埃伦).doc
- 原因分析指南07.8.2(免费阅读).ppt
- 原因可能与体育锻炼在学生自我概念中的作用有关.doc
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)