- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
川大数据结构与算法分析第十章文件
Chapter 10File; 11.1 有关文件的基本概念
;11.1 有关文件的基本概念
;一、文件即为记录的集合,和“查找
表”的差别在于,“文件”指的是存
储在外存储器中的记录的集合。
记录是文件中可以存取的数据的
基本单位。
;二、文件可按其中记录的类型不同而
分成两类:
;其二 为数据库文件,文件中的记录带
有结构,是数据项的集合。记录
是文件中可以存取的数据基本单
位,数据项是文件中可以使用的
数据最小单位。;三、记录中能识别不同记录的数据项
被称为关键字,若该数据项能唯
一识别一个记录,则称为主关键
字,若能识别多个记录则称为次
关键字。
;四、文件的逻辑结构指的是呈现在用
户面前的文件中记录之间的逻辑
关系;文件的物理结构指的是文
件中的逻辑记录在存储器中的组
织方式。
;五、文件的操作:; 1.检索;2.修改;文件的操作方式可以实时处理或
批量处理。; 本章讨论文件的几种常见的
物理结构:
;11.2 顺 序 文 件
;结 构 特 点:
;顺序文件的具体组织形式有两种:
;操作特点:;3.插入新的记录只能加在文件的末尾;
4.删除记录时,只作标记;
5.更新记录必须生成新的文件。; 顺序文件的插入、删除和更新操
作在多数情况下都采用批处理方式。
此时,为处理方便,通常将顺序文件
作成有序文件,称作“主文件”,同时
将所有的操作作成一个“事务文件”
(经过排序也成为有序文件),所谓
“批处理”,就是将这两个文件“合”为
一个新的主文件。具体操作相当于
“归并两个有序表”。;
(1)对于事务文件中的每个操作
首先要判别其“合法性”
;
假设主文件中含有n个记录,事
务文件中含有m个记录,则对事务文
件进行排序的时间复杂度为O(mlogm),
内部归并的时间复杂度为O(m+n),
则总的内部处理的时间为O(mlogm+n)。
; 假设对外存进行一次读/取为s个
记录,则整个批处理过程中读/写外存
的次数为2?(?m/s?+?(m+n)/s?)
;11.3 索 引 文 件
;一、结构特点:;二、操作的特点:;3.删除记录时,仅需删除索引表中相应的索引项即可;
4.更新记录时,应将更新后的记录插入在主文件的末尾,同时修改相应的索引项。;1.多 级 静 态 索 引;1.多级静态索引; 主 文 件;对主文件中每个记录建立一个索引项: ;从索引表建立的索引称查找表,其中
每个索引项为:;;索引表采用查找树表或哈希表。优点:;用查找树表作索引时,查找索引所
需访问外存次数的最大值恰为查找
树的深度。;11.4 索 引 顺 序 文 件;
主文件按主关键字有序,对一组记
录建立一个索引项(建立非稠密索引)。;一、ISAM文件
ISAM(Index Sequential Access Method)
(索引顺序存取方法)是一种专为磁
盘存取设计的文件组织方法。
;1.文件的组织方式:
;210;2.操作的特点:
;检索:
可有两种方式:
;插入:
;删除:;3.文件重组
;4.柱面索引的位置
;二、VSAM文件
VSAM(Vistual Storage Access Method)
;… ...;
2. 控制区间是用户进行一次存取的
逻辑单位,可看成是一个逻辑磁道。
但它的实际大小和物理磁道无关。 ;3.顺序集本身是一个单链表,它
包含文件的全部索引项,同时,顺
序集中的每个结点即为B+树的叶子
结点,索引集中的结点即为B+树的
非叶结点。
;4.文件的操作;5.VSAM文件通常被作为大型索引
顺序文件的标准组织方式。
;10.5 直 接 存 取 文 件
;1.和前几节讨论的文件组织方法
不同,直接存取文件的特点是,由
记录的关键字“直接”得到记录在外
存上的映象地址。
;2.哈希文件的结构
;例如:有一组关键字如下所列
{589,063,269,505,764,182,166,330}
假设哈希函数为 key MOD 7,每个桶可以容纳
3个记录(称桶的容量为3),则哈希文件如下:
; 在哈希文件中,“冲突”和“溢出”
是不同的概念。一般情况下,假设桶
文档评论(0)