[北京邮电大学数据结构与算法课件]DSC12.pptVIP

[北京邮电大学数据结构与算法课件]DSC12.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[北京邮电大学数据结构与算法课件]DSC12.ppt

* 第十二章. 文件 (Chapter 12. Files ) §12.1 基本概念 文件 ( files ): 由大量相同性质的记录组成的集合,通常存储在外存储器上。 定长记录 ( have fixed size records ): 文件中所有记录均含有相同的信息长度,则称为定长记录,此类文件称为定长记录文件。 不定长记录 ( have variable size records ): 文件中记录含有信息长度不同,则称为不定长记录,此类文件称为不定长文件。 单关键字 ( have only one key ): 记录中只有一个唯一标识记录的主关键字,称为单关键字文件。 多关键字 ( have more than one key ): 文件记录中除主关键字外,还含有若干个次关键字,称为多关键字文件。 文件的逻辑记录和物理记录间存在 1:1、1:m 和 m:1 三种对应关系。对文件的操作通常有检索和修改两类:文件的检索操作通常有顺序存取、直接存取和按关键字存取三种方式;文件的修改通常也有插入记录、删除记录和更新记录三种操作。 §12.2 顺序文件 顺序文件(sequential file)是记录按其在文件中的逻辑顺序依次存放在存储介质上而建立的文件,即顺序文件中物理记录的顺序与逻辑记录的顺序是相同的。若两个次序相继的物理记录在存储介质上的存储位置也是相邻的,称为连续文件;反之则物理记录间由指针相连,称为串联文件。 顺序文件的特点: 2、新的记录只能插入在文件的末尾; 3、要更新文件中某个记录必须复制整个文件。 为避免文件记录修改(一般频率较低)时复制整个文件效率太低,通常可另建一个附加文件,待附加文件增大到一定程度时再进行整个文件的更新。检索时先查主文件,不成功时再查附加文件。 §12.3 索引文件 1、必须顺序存取,即要找第 i 个记录,须先找第 i-1 个记录; 除文件本身以外,另建一个指引逻辑记录与物理记录间一 一对应关系的索引表,这类文件称为索引文件(indexed file)。索引表中的每一项称为索引项;若文件记录按关键字顺序排列,称为索引顺序文件;否则称为索引非顺序文件。索引文件的检索有直接存取和按关键字存取两类。为每个记录建立一个索引项称为稠密索引;对一组记录建立一个索引称为非稠密索引。 §12.4 ISAM 文件和 VSAM 文件 一、ISAM 文件 索引顺序存取方法(Indexed Sequential Access Method)文件,是一种专为磁盘存取设备设计的文件 组织方式,它是一种多级索引文件:由磁盘组、柱面和磁道组成三级索引。每个柱面上还设有溢出区。磁道索引项的结构如下: 关键字 指针 关键字 指针 基本索引项 溢出索引项 ISAM 文件中删除记录较容易,但插入记录则可能移动记录到溢出区。时间一长,基本索引区可能删空,而溢出区又可能快满,此时需要对文件重新排列以建立新的 ISAM 文件。 二、VSAM 文件 虚拟存储存取方法(Virtual Storage Access Method)文件,是利用了操作系统的虚拟存储器功能,给用户提供方便。对用户而言,只需知道文件逻辑结构和相应的控制区结构,不需要知道文件的物理存储结构,逻辑记录与物理记录间的对应关系由操作系统完成。数据集中的一个结点称为控制区间(control interval);顺序集中的一个结点连同其对应的所有控制区间形成一个整体,称为控制区域(control range)。其控制区示意如下: ... ... ... ... 控制区域 控制区间 数据集 顺序集 索引集 } B+树 §12.5 直接存取文件(散列文件) VSAM 文件的记录可以是不定长的,由于它没有溢出区,在初建文件时保留一定的空间以利于插入记录。删除记录时需将同一控制区间中较删除记录关键字大的记录向前移动,把空间留给后插入的新记录;若整个控制区域变空,则需修改顺序集中相应的索引项。VSAM 文件的优点是动态分配和释放存储器,不需要对文件进行重组,并能较快地对插入的记录进行查找,查找一个后插入的记录与查找一个原有的记录的时间相同。 直接存取文件是指利用哈希(hash)法进行组织的文件。散列文件的记录通常是成组存放的, 每个存储单位叫着桶(bucket),可以存放 m 个记录,亦即 m 个同义词可以存放在同一地址的桶中,而当 m+1 个同义词出现时方发

文档评论(0)

jz6501 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档