数据结构-11文件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数 据 结 构(Data Structure ) 主讲:严冬梅 第11章 文件(File) 第11章 文件 11.1 文件的基本概念 11.2 顺序文件 11.3 索引文件和索引顺序文件 11.4 哈希文件 11.5 多关键码文件 文件:文件是存储在外部介质上的由大量性质相同的记录组成的集合。按其记录的类型不同可以分为两类:程序文件和数据文件。 程序文件是一维的、连续的、无结构的字符序列,可以看成是由一条无结构的记录组成的文件。 数据文件是带有结构的、性质相同的记录的集合。每个记录由若干个数据项组成,数据项是最基本的不可分割的数据单位,也是文件中可以操作的最小数据单位。本章介绍的就是数据文件的组织结构及其处理方式。 11.1 文件的基本概念 关键字:能够标识文件中记录的数据项称为关键字,能够唯一标识记录的关键字称为主关键字,否则为次关键字。 记录的逻辑结构:是指文件的记录在用户或应用程序员面前逞现的方式,是对数据间的客观联系的一种表示,是用户对数据的存取方式。 记录的物理结构:是指文件中的记录在物理存储介质上的存储方式,是数据的物理表示和组织。根据不同的需要、设备本身的特性及操作系统中的文件系统,记录的物理结构可以有不同的表示和组织方法。 11.1 文件的基本概念 物理记录:是计算机用一条I/O命令进行读写的基本数据单位,对于确定的设备和操作系统,它的大小基本上是固定不变的。 物理记录与逻辑记录的关系:物理记录与逻辑记录之间有三种可能的关系,分别为一个物理记录中存放一个逻辑记录、一个物理记录中存放多个逻辑记录、多个逻辑记录存储于一个物理记录中。 11.1 文件的基本概念 文件的存取 文件存储在外部介质上,所以对文件的存取要通过访问外存储介质来实现。外存储介质的共同特点是存储容量大,存取速度慢。以目前使用最为广泛的磁盘存储器为例,读写磁盘上的信息,首先要经过选定柱面、选定磁道、选定扇区(即物理记录)三步机械定位动作,然后才能通过磁头读写盘片上的信息。 此外,主机对外存储介质上的数据不能直接进行存取,要读取外存储介质上的数据,首先要通过通道把数据读到内存的一个指定区域(缓冲区)中,然后从缓冲区中读取有关的数据。写操作的过程则相反,先将内容写到缓冲区中,然后通过通道将缓冲区中的数据写到外存储介质上。外存储介质上的数据存取时间往往比主机对数据进行处理的时间花费大,所以对外存储介质上的数据处理常常以访问外存储介质次数的多少作为衡量其数据结构及其算法质量的标准。节省存取时间的有效方法是:在每次访问外存储介质时,传送批量的数据,从而减少访问外存储介质的次数。 11.1 文件的基本概念 文件的存储结构 顺序结构:记录在外存储器中的存放顺序与记录在文件中的逻辑顺序完全一致。 计算寻址结构:类似于哈希表,记录在外存储器中的存储位置由选定的哈希函数和处理冲突的方法确定。 索引结构:为顺序文件中的每个记录建立一个索引项(由记录的关键码和记录的存储位置两项组成),所有记录的索引项构成一个索引,由索引和顺序文件构成的文件为索引件。若顺序文件中记录按关键码有序,则为索引顺序文件。 表结构:类似于线性表的链表存储结构,记录之间利用“指针”进行相互链接。在此,“指针”通常指的是页块的物理地址。 11.1 文件的基本概念 选择文件存储结构应考虑的因素 外存的种类 询问的类型 操作类型 操作方式 11.1 文件的基本概念 顺序文件的记录是按其在文件中的逻辑顺序依次存入存储介质的。它是一种顺序组织方式。若次序相继的两个物理记录在存储介质上的存储位置是相邻的,则称为连续文件;若物理记录之间的次序由指针链表示,则称为串联文件。 由于顺序文件中记录的物理次序与逻辑次序是一致的,所以适宜于顺序存取(即存取一个记录之后接着存取其后继记录)和批量处理。但是对顺序文件中记录的随机存取效率很低。 11.2 顺序文件 11.2.1 存储在顺序存储器上的顺序文件 一切存储在顺序存储器(如磁带)上的文件,都是顺序文件,这种文件只能进行“顺序存取”和成批处理。 顺序存取是指按记录的逻辑(或物理)顺序实现逐个存取,若要查询第i个记录则必须先检索前i-1个记录,插入新的记录只能加在文件的末尾。由于顺序存储设备不可能做到修改某个确切位置上的信息,即使更新一个记录也必须对整个文件进行复制。因此对顺序文件的操作更多的情况下是按批处理的方式进行的。 批处理方式,即在积累了一批更新要求之后,统一进行一次性处理。 11.2 顺序文件 11.2.2 存储在直接存取存储器上的顺序文件 存储在磁盘等直接存取设备上的顺序文件的处理方法和存储在顺序存储器上的文件相同,此外,由于设备本身所具备的随机存取能力,还可以对文件记

文档评论(0)

123****6651 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档