高级数据库索引技术.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级数据库索引技术

Function:Search 描述:假设T为一棵R树的根结点,查找所有搜索矩形S覆盖的记录条目。 S1:[查找子树] 如果T是非叶子结点,如果T所对应的矩形与S有重合,那么检查所有T中存储的条目,对于所有这些条目,使用Search操作作用在每一个条目所指向的子树的根结点上(即T结点的孩子结点)。 S2:[查找叶子结点] 如果T是叶子结点,如果T所对应的矩形与S有重合,那么直接检查S所指向的所有记录条目。返回符合条件的记录。 R树操作 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 设有一个存放顾客购买金首饰记录的关系表(age,salary)。为使问题简化,我们假设该关系只有顾客年龄和月薪两个属性。 ---实例数据中有12个顾客,相关记录被表示成下列的年龄-薪水对:(26,0.6) (45,0.6) (51,0.75) (51,1)(51,1.28)(70,1.30) (85,1.4) (30,2.6) (26,4.0) (45,3.5)(51,2.75)(60,2.6) 特定查询:根据坐标找到数据块 部分匹配查询:最近邻查询 一个特定点P,找到P的桶,然后查找与P点有一定距离的L的点。 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 位图的优点: 减少即席查询的相应时间。 和其它类型索引比较,真正节约了索引数据空间。 即使在非常差的硬件上,也可能会有戏剧化的性能提升。 可以通过位图索引直接计数。 位图索引的缺点 如果有比较频繁的insert,update等操作,导致性能很低 可能会溢出,索引数据块难于放下整个索引值,这导致低效。 谢 谢! 安徽师范大学硕士学位论文开题报告 安徽师范大学硕士学位论文开题报告 高级数据库索引技术 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 散列与散列函数 散列函数选择要求:随机分布好、易计算; 散列函数参数:查找键或散列键; 基于散列的存储结构 通常是每个散列值对应一个存储目标对象的桶(页/块) 存储到桶的对象,既可能是实际数据项或数据记录,也可以是数据记录指针; 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 散列函数形式:M=hash(k) 散列函数条件: 1、搜索码值的分布呈均匀分布 2、记录的分布呈均匀分布 静态散列索引 5449 5450 5595 5349 5350 5451 5897 5349 王悦 32 5350 李丽 31 5449 王永 32 5450 Ella 36 5451 李永 29 5595 杜华 42 5897 王永 40 5901 武岳 39 5901 桶0 桶1 桶1溢出桶 各位数字之和与桶数模运算 静态散列操作 静态索引技术的特点:桶的数目是事先分配好的,且数目固定。 其缺点是当索引文件发生变化时,桶数目无法改变。 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 散列函数将这些键转换成的二进制位序列。因此,第一块有一个键被散列为0001的记录;而第二个块存放着键分别散列为1001和1100的记录。 我们应该注意到图中每个存储块的“小方块”中都出现了数字1。这个数字其实出现在每个存储块的块头中,表明由散列函数得到的位序列中有多少位用于确定记录在该块中的成员资格。 可扩展散列索引 可扩展散列索引 1.如果ji,那么不必对桶数组做什么变化。我们: a)将块B分裂成两个存储块。 b)根据记录散列值的第(j+1)位,将B中记录分配到这两个存储块中,该位为0的记录保留在B中,而该位为1的记录则放入到新块中。 c)把(j+1)存入这两个存储块的小方块中,以表明用于确定成员资格的二进制位数。 d)调整桶数组中的指针,使原来指向块B的项指向块B或新块,这由项的第(j+1)位决定。 可扩展散列索引操作 可扩展散列索引操作 如果j=i,那么我们必须先将i加1。我们使桶数组长度翻了一倍,因此数组中现在有2i+1个项。假定w是以前的桶数组中作为某项序号的i位二进制位序列。在新桶数组中,序号为w0和w1(即分别用0和1扩展w所得到的数)的项都指向原w项指向的块。也就是说,这两个新项共享同一个存储块,而存储块本身没有变化。该块的成员资格仍然按原先的位数确定。最后,我们继续像第一种情况中那样分裂B。 动态散列索引优点: 空间开销小,算法查询速度快,且与数据文件大小无关 动态散列索引缺点: 当桶数量增加时,其扩展的代价非常昂贵 散列索引 静态散列索引 动态散列索引 多维索引 R树 网格文件 位图索引 ㈠数据仓库的数据立方体 ㈡地理信息系统(GIS) ㈢CAD/CAM系统

文档评论(0)

整理王 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档