数据结构与算法分析(Java版) 作者 第10章.pptVIP

数据结构与算法分析(Java版) 作者 第10章.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10章 文件管理和外排序 10.1 文件的基本概念 10.2 文件的分类 10.3 直接存取文件(散列文 件) 10.4 多关键字文件 10.5 文件的存储 10.6 外部排序 10.1 文件的基本概念 10.1.1 文件定义 文件的定义是性质相同的记录的集合,它通常存储在外存(辅助存储器)上,本章以外存储器为主考虑。 在文件中常见的术语有: 记录:是文件中存取的基本单位,数据项是文件可使用的最小单位。 数据项:有时也称为字段,或者称为属性。 主关键字项:其值能惟一标识一个记录的数据项或数据项的组合称为主关键字项。 次关键字项:其值不能惟一标识一个记录的数据项则称为次关键字项。 10.1 文件的基本概念 主关键字(或次关键字):主关键字项(或次关键字项)的值称为主关键字(或次关键字)。 单关键字文件:若文件中的记录只有一个惟一标志记录的主关键字。 多关键字文件:若文件中的记录只有一个惟一标志记录的主关键字外,还含有若干个次关键字。 按照构成文件的记录结构的长度分为定长记录文件和不定长记录文件。 文件中记录含有的信息长度相同,称为定长记录,由定长记录组成的文件称为定长文件。 若文件中记录含有的信息长度不等,则称为不定长文件。 10.1 文件的基本概念 10.1.2 文件逻辑结构及操作 记录的逻辑结构是指记录在用户或应用程序员面前呈现的方式,是用户对数据的表示和存取方式 对应不同结构的记录也分别称为物理记录和逻辑记录,它们之间有以下关系: (1)一条物理记录存放一条逻辑记录。 (2)一条物理记录存放多条逻辑记录 (3)多个物理记录存储一条逻辑记录。 10.1 文件的基本概念 中文件的检索有三种方式: (1)顺序存取:按记录号依次存取逻辑记录。 (2)直接存取:按照记录号或记录的相对位置直接取得需要的记录。 (3)按关键字存取:给定一个关键字的值,查询一个或椅披关键字与给定值相关的记录,一般有四种查询: a.?简单查询:查询关键字等于给定值的记录。例如查询学号是“00001”的记录。 b.?区域查询:查询关键字属于某个范围的的记录。例如查询成绩在80分以上的所有记录。 c.?函数查询:给顶的关键字的值使函数成立的记录。例如查询所有男生的记录。 d.? 布尔查询:通过布尔运算组合起来的查询。例如查询男生中成绩在90分以上的2003届的所有记录。 10.2 文件的分类 10.2.1 顺序文件 记录按其在文件中的逻辑顺序依次存入存储介质所建立的文件。顺序文件是根据记录的序号或记录的相对位置来进行存取的文件组织方式。 其特点是: (1)存取第I个记录,必须先搜索第I-1个记录。 (2)插入新的记录时只能加在文件的末尾。 (3)若要更新文件中的某个记录,则必须将整个文件进行复制。 顺序文件的优点是连续存取的速度快,因此主要用于只进行顺序存取、批量修改的情况。顺序文件的存储介质比较典型的是磁带。 10.2 文件的分类 10.2.2 索引文件 索引文件是有索引区和文件数据区两部分组成,其中文件数据区按关键字有序的称为索引顺序文件;文件数据区中记录不按关键字顺序排列称为索引非顺序文件;索引非顺序文件通常是指索引文件。 数据区和索引表构成索引文件。 建立索引文件的主要目的是提高查询速度,对索引文件而言其检索步骤为:首先将外存上含有索引区的页块送入内存,查找所需记录的物理地址,然后在将该记录的页块送入内存。若索引表不大,则可将索引表一次读入内存,因此索引文件中进行检索只需两次访问外存:一次读索引,一次读记录。 10.2 文件的分类 索引非顺序文件适合于随机存取,不适合于顺序存取。索引顺序文件既适合于随机存取,又适合于顺序存取;索引顺序文件是稀疏索引,占用空间较少;而索引非顺序文件是稠密索引。 ISAM(索引顺序存取方法) VSAM VSAM文件有如下优点: 较高的查找效率,查找一个后插入记录和查找一个原有记录具有相同的速度; 动态地分配和释放存储空间,而且不必对文件进行再组织。 10.3 直接存取文件(散列文件) 散列文件是利用散列存储方式组织的文件,亦称为直接存取文件 与散列表不同的是,对于文件来说,磁盘上的文件记录通常是成组存放的,若干个记录组成一个存储单位,在散列文件中,这个存储单位叫做桶 假如一个桶能存放m个记录,则当桶中已有m个同义词的记录时,存放第m+1个同义词会发生“溢出” 散列文件的优点是:文件随机存放,记录不需进行排序;插入、删除方便;存取速度快;不需要索引区,节省存储空间。 散列文件的缺点是:不能进行顺序存取,只能按关键字随机存取,询问方式简单,大量增删后,需要重新组织文件。 10.4 多关键字文件 1、多重表文件 2、倒排文件 优点:可

您可能关注的文档

文档评论(0)

时间加速器 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档