网站大量收购独家精品文档,联系QQ:2885784924

B树-B+树-B 树谈到R树.pdf

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
B树-B树-B树谈到R树

从B 树、B+ 树、B* 树谈到R 树 作者:July、weedge、Frankie。编程艺术室出品。 说明:本文从B 树开始谈起,然后论述B+树、B*树,最后谈到R 树。其中B 树、B+树 及 B*树部分由 weedge 完成,R 树部分由 Frankie 完成,全文最终由 July 统稿修订完成。 出处:/v_JULY_v 。 第一节、B 树、B+树、B*树 1.前言: 动态查找树主要有:二叉查找树(Binary Search Tree ),平衡二叉查找树 + (Balanced Binary Search Tree ),红黑树(Red-Black Tree ) ,B-tree/B -tree/ * B -tree (B~Tree)。前三者是典型的二叉查找树结构,其查找的时间复杂度O(log N)与 2 树的深度相关,那么降低树的深度自然会提高查找效率。 但是咱们有面对这样一个实际问题:就是大规模数据存储中,实现索引查询这样一 个实际背景下,树节点存储的元素数量是有限的(如果元素数量非常多的话,查找就退化 成节点内部的线性查找了),这样导致二叉查找树结构由于树的深度过大而造成磁盘I/O 读写过于频繁,进而导致查询效率低下(为什么会出现这种情况,待会在外部存储器-磁 盘中有所解释),那么如何减少树的深度(当然是不能减少查询的数据量),一个基本的 想法就是:采用多叉树结构(由于树节点元素数量是有限的,自然该节点的子树数量也就 是有限的)。 这样我们就提出了一个新的查找树结构——多路查找树。根据平衡二叉树的启发, 自然就想到平衡多路查找树结构,也就是这篇文章所要阐述的第一个主题B~tree(B 树结 构)。 B-tree (B-tree 树即B 树)这棵神奇的树是在Rudolf Bayer, Edward M. McCreight(1970)写的一篇论文《Organization and Maintenance of Large Ordered Indices》中首次提出的(wikipedia 中: /wiki/B-tree ,阐述了B-tree 名字来源以及相关的开源地 址)。 在开始介绍B~tree 之前,先了解下相关的硬件知识,才能很好的了解为什么需要B~tree 这种外存数据结构。 2.外存储器—磁盘 计算机存储设备一般分为两种:内存储器(main memory)和外存储器(external memory)。 内存存取速度快,但容量小,价格昂贵,而且不能长期保存数据(在不通电情 况下数据会消失)。 外存储器—磁盘是一种直接存取的存储设备(DASD)。它是以存取时间变化不大为特征的。 可以直接存取任何字符组,且容量大、速度较其它外存设备更快。 2.1 磁盘的构造 磁盘是一个扁平的圆盘(与电唱机的唱片类似)。盘面上有许多称为磁道的圆圈,数据就记 录在这些磁道上。磁盘可以是单片的,也可以是由若干盘片组成的盘组,每一盘片上有两 个面。如下图11.3 中所示的6 片盘组为例,除去最顶端和最底端的外侧面不存储数据之 外,一共有 10 个面可以用来保存信息。 当磁盘驱动器执行读/写功能时。盘片装在一个主轴上,并绕主轴高速旋转,当磁道在读/ 写头(又叫磁头) 下通过时,就可以进行数据的读/ 写了。 一般磁盘分为固定头盘(磁头固定)和活动头盘。固定头盘的每一个磁道上都有独立的磁头, 它是固定不动的,专门负责这一磁道上数据的读/写。 活动头盘 (如上图)的磁头是可移动的。每一个盘面上只有一个磁头(磁头是双向的,因此 正反盘面都能读写)。它可以从该面的一个磁道移动到另一个磁道。所有磁头都装在同一 个动臂上,因此不同盘面上的所有磁头都是同时移动的(行动整齐划一)。当盘片绕主轴旋 转的时候,磁头与旋转的盘片形成一个圆柱体。各个盘面上半径相同的磁道组成了一个圆 柱面,我们称为柱面 。因此,柱面的个数也就是盘面上的磁道数。 2.2 磁盘的读/写原理和效率 磁盘上数据必须用一个三维地址唯一标示:柱面号、盘面号、块号(磁道上的盘块)。 读/写磁盘上某一指定数据需要下面3 个步骤: (1) 首先移动臂根据柱面号使磁头移动到所需要的柱面上,这一过程被称为定位或查找 。 (2)

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档