- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 第十章 外部排序 10.1 外存信息的特性 10.2 外排序的基本方法 10.3 总结与提高 10.1 外存信息的特性 存储器 内部存储器 (内存) 外部存储器 (外存) 顺序存取设备(磁带存储器) 直接存取设备(磁盘存储器) 内存的存储容量小,但工作速度高;外存的存储容量大,但速度较低。 10.1.1 磁带存储器 优点:存储容量大,使用方便,价格便宜。 1. 特性:磁带存储器主要由磁带、读/写磁头和磁带驱动器组成,如下图所示。 目前常用的典型磁带长2400英尺,宽0.5英寸,厚0.002英寸。磁带表面上涂有磁性材料,可分为七道或九道磁带。 七道磁带的每一横排中有六个二进制数据位和一个奇偶校验位。九道磁带的每一横排中有八个二进制数据位和一个奇偶校验位。这样的一排二进制数据位组成一个字节。 2. 分页块存储方法 磁带存储器是一种典型的顺序存取设备。所谓顺序存取,就是将记录在存储器上一个接一个地依次存放,为得到第i个记录,必须先读第i-1个记录。 由于磁带机不是连续运转的设备,而是一种启停设备,所以在启停时间内,不能对磁带进行正常读写,因此磁带上的信息通常分为若干记录块,块与块之间留有一定的间隙,该间隙一般为1/4~3/4英寸。 由上可知,用磁带存储信息时需要在每段信息之间留有空隙,且此空隙占用了大量的存储空间 。为了减少存储空间的浪费,通常采用把若干个记录组合成页块进行存储的办法,将记录间的间隙变成页块间的间隙。 10.1.2 磁盘存储器 优点:既能进行顺序存取,又能进行直接存取(随即存取),并且存取速度快。 1. 磁盘存储器的特性 磁盘存储器主要由磁盘组和磁盘驱动器组成。磁盘组由若干个盘片组成,每个盘片有上下两个面,盘面上涂有光滑的磁性物质。 盘面上能够存储信息的盘面称为记录面。在记录盘面上有许多称为磁道的圆圈,信息就记载在磁道上。磁盘驱动器由主轴和读/写磁头组成,每个盘面都配有一个读/写磁头。 磁盘可分为固定臂盘和活动臂盘两种。固定臂盘的每个盘面的每一磁道上都有独立的磁头,它是固定不动的,专门负责读写某一磁道上的信息。 如图: 2. 分页块存储法 为了减少访问外存的次数,一般采用把记录组合成页块的方式来进行内外存数据的交换。一个页块(简称块)是磁盘上的一个物理记录,通常可以容纳多个逻辑记录,内存中设置的缓冲区应该与页块的大小相等。每次访问记录时,需要把一个页块读入一个缓冲区或者把一个缓冲区的数据写到一个页块。 10.2 外排序的基本方法 最常用的外部排序方法是归并排序法。这种方法由两个阶段组成:第一阶段是把文件逐段输入到内存,用有效的内排序方法对文件的各个段进行排序,经排序的文件段称为顺串(或归并段),当它们生成后立即写到外存上,这样在外存上就形成了许多初始顺串;第二阶段是对这些顺串用某种归并方法(如2路归并法)进行多边归并,使顺串的长度逐渐由小至大,直至变成一个顺串,即整个文件有序为止。 10.2.1 磁盘排序 1.例子:假设磁盘上存有一文件,共有3600个记录(A1,A2,…,A3600),页块长为200个记录,供排序使用的缓冲区可提供容纳600个记录的空间,现要对该文件进行排序,排序过程可按如下步骤进行: 第一步:每次将三个页块(600个记录)由外存读到内存,进行内排序,整个文件共得到6个初始顺串R1~R6 (每一个顺串占三个页块),然后把它们写回到磁盘上去。内排序后得到的初始顺串见p260的图10.3所示。 第二步:将供内排序使用的内存缓冲区分为三块相等的部分(即每块可容纳200个记录),其中两块作为输入缓冲区,一块作为输出缓冲区,然后对各顺串进行两路归并。归并过程见p261的图10.4所示。 2. 多路归并 一般说来,如果初始顺串有m个,则如图10.4所示那样的归并树就有[log2m]+1层,要对数据进行[log2m]遍扫描。采用多路归并可以减少扫描遍数,如图所示。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ? 图10.5 16个顺串归并的示例 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 在k路归并中,为了确定下一个要输出的记录,就需要在k个记录中寻找关键字值最小的那个记录,这要比2路归并复杂些。如果逐个比较每个顺串的待选记录,从而选出一个关键字值最小的记录,则每选取一个记录需要进行k-1次比较。为了减少这个代价,我们可采用下面介绍的选择树的方法来实现k路归并。 选择树是一种完全二叉树,下
您可能关注的文档
- 申论必看范文10篇和写作方法.doc
- 深基坑工程桩锚支护设计计算理论和应用.ppt
- 深交所及中国结算基金业务文件数据接口规范.pdf
- 生产者程序及流程图.doc
- 生产作业计划及作业排序.ppt
- 生成函数及排列组合.ppt
- 生成排列与组合.doc
- Photoshop文件格式.doc
- PHP-javascript中函数.pdf
- 生物技术及生物产品的检验方法与质量标准.pdf
- circuit cellaratmel avr设计大赛2006abstract entryat3329摘要条目.pdf
- 单元测试脚本财务核算组口岸业务流程tw v0.pdf
- 来源分布yeyvary等分散性count data计数据.pdf
- 高速陆地蜂窝结构进程号.pdf
- 信件选择淘金探.pdf
- 高二译牛模块选修同步辅导词汇结.pdf
- mtk平台写工具使用说明人工1 aenhelp writeimei.pdf
- 多脉冲转换器1lecture 2012 multipulse11th.pdf
- wy八级教学资源库16下unit 2.pdf
- 在社会反馈中考虑个人口味以改善饮食习惯paperw135.pdf
文档评论(0)