川大数据结构与算法分析第十章文件.pptVIP

川大数据结构与算法分析第十章文件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
川大数据结构与算法分析第十章文件

Chapter 10 File; 11.1 有关文件的基本概念 ;11.1 有关文件的基本概念 ;一、文件即为记录的集合,和“查找 表”的差别在于,“文件”指的是存 储在外存储器中的记录的集合。 记录是文件中可以存取的数据的 基本单位。 ;二、文件可按其中记录的类型不同而 分成两类: ;其二 为数据库文件,文件中的记录带 有结构,是数据项的集合。记录 是文件中可以存取的数据基本单 位,数据项是文件中可以使用的 数据最小单位。;三、记录中能识别不同记录的数据项 被称为关键字,若该数据项能唯 一识别一个记录,则称为主关键 字,若能识别多个记录则称为次 关键字。 ;四、文件的逻辑结构指的是呈现在用 户面前的文件中记录之间的逻辑 关系;文件的物理结构指的是文 件中的逻辑记录在存储器中的组 织方式。 ;五、文件的操作:; 1.检索;2.修改;文件的操作方式可以实时处理或 批量处理。; 本章讨论文件的几种常见的 物理结构: ;11.2 顺 序 文 件 ;结 构 特 点: ;顺序文件的具体组织形式有两种: ;操作特点:;3.插入新的记录只能加在文件的末尾; 4.删除记录时,只作标记; 5.更新记录必须生成新的文件。 ; 顺序文件的插入、删除和更新操 作在多数情况下都采用批处理方式。 此时,为处理方便,通常将顺序文件 作成有序文件,称作“主文件”,同时 将所有的操作作成一个“事务文件” (经过排序也成为有序文件),所谓 “批处理”,就是将这两个文件“合”为 一个新的主文件。具体操作相当于 “归并两个有序表”。; (1)对于事务文件中的每个操作 首先要判别其“合法性” ; 假设主文件中含有n个记录,事 务文件中含有m个记录,则对事务文 件进行排序的时间复杂度为O(mlogm), 内部归并的时间复杂度为O(m+n), 则总的内部处理的时间为O(mlogm+n)。 ; 假设对外存进行一次读/取为s个 记录,则整个批处理过程中读/写外存 的次数为2?(?m/s?+?(m+n)/s?) ;11.3 索 引 文 件 ;一、结构特点: ;二、操作的特点:;3.删除记录时,仅需删除索引表中相应的索引项即可; 4.更新记录时,应将更新后的记录插入在主文件的末尾,同时修改相应的索引项。;1.多 级 静 态 索 引;1.多级静态索引; 主 文 件;对主文件中每个记录建立一个索引项: ;从索引表建立的索引称查找表,其中 每个索引项为:;; 索引表采用查找树表或哈希表。 优点:;用查找树表作索引时,查找索引所 需访问外存次数的最大值恰为查找 树的深度。;11.4 索 引 顺 序 文 件; 主文件按主关键字有序,对一组记 录建立一个索引项(建立非稠密索引)。;一、ISAM文件 ISAM(Index Sequential Access Method) (索引顺序存取方法)是一种专为磁 盘存取设计的文件组织方法。 ;1.文件的组织方式: ;210;2.操作的特点: ;检索: 可有两种方式: ;插入: ;删除:;3.文件重组 ;4.柱面索引的位置 ;二、VSAM文件 VSAM(Vistual Storage Access Method) ;… ...; 2. 控制区间是用户进行一次存取的 逻辑单位,可看成是一个逻辑磁道。 但它的实际大小和物理磁道无关。 ;3.顺序集本身是一个单链表,它 包含文件的全部索引项,同时,顺 序集中的每个结点即为B+树的叶子 结点,索引集中的结点即为B+树的 非叶结点。 ;4.文件的操作;5.VSAM文件通常被作为大型索引 顺序文件的标准组织方式。 ;10.5 直 接 存 取 文 件 ;1.和前几节讨论的文件组织方法 不同,直接存取文件的特点是,由 记录的关键字“直接”得到记录在外 存上的映象地址。 ;2.哈希文件的结构 ;例如:有一组关键字如下所列 {589,063,269,505,764,182,166,330} 假设哈希函数为 key MOD 7,每个桶可以容纳 3个记录(称桶的容量为3),则哈希文件如下: ; 在哈希文件中,“冲突”和“溢出” 是不同的概念。一般情况下,假设桶

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档