- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文 件
12.1 有关文件的基本概念
一、文件即为记录的集合,和“查找表”的差别在于,“文件”指的是存储在外存储器中的记录的集合。记录是文件中可以存取的数据的基本单位。
二、文件可按其中记录的类型不同而分成两类:
其一为操作系统的文件,文件中的记录仅是一个字符组。由于操作系统中的文件仅是一维的连续字符序列,为了用户存取和加工的方便,将文件中的信息划分为若干组,其中每一组信息称作一个记录;
其二为数据库文件,文件中的记录带有结构,是数据项的集合。记录是文件中可以存取的数据基本单位,数据项是文件中可以使用的数据最小单位。
三、记录中能识别不同记录的数据项被称为关键字,若该数据项能唯一识别一个记录,则称为主关键字,若能识别多个记录则称为次关键字。
四、文件的逻辑结构指的是呈现在用户面前的文件中记录之间的逻辑关系;文件的物理结构指的是文件中的逻辑记录在存储器中的组织方式。
五、文件的操作:
1.检索:
顺序存取:存取“当前记录的”下一个记录;
直接存取:存取第i个记录;
按关键字存取:存取其关键字等于给定值的记录。
2.修改:
往文件中插入一个或一批记录;
从文件中删除一个或一批记录;
更新文件中某个记录的属性。
3.排序
文件的操作方式可以实时处理或批量处理
本章讨论文件的几种常见的物理结构。
12.2 顺序文件
结构特点:
记录在文件中的排列顺序是由记录进入存储介质的次序决定的,即文件物理结构中记录的排列顺序和文件的逻辑结构中记录的排列顺序一致。
顺序文件的具体组织形式有两种:
连续文件:次序相继的两个物理记录其存储位置相邻;
串联文件:物理记录之间的顺序由指针相链。
操作特点:
1.便于进行顺序存取;
2.不便于进行直接存取,为取第i个记录,必须先读出前i-1个记录,对于磁盘上的等长记录的连续文件可以进行折半查找;
3.插入新的记录只能加在文件的末尾;
4.删除记录时,只作标记;
5.更新记录必须生成新的文件。
顺序文件的插入、删除和更新操作在多数情况下都采用批处理方式。此时,为处理方便,通常将顺序文件作成有序文件,称作“主文件”,同时将所有的操作作成一个“事务文件”(经过排序也成为有序文件),所谓“批处理”,就是将这两个文件“合”为一个新的主文件。具体操作相当于“归并两个有序表”,但有两点不同:(1)对于事务文件中的每个操作首先要判别其“合法性”;(2)事务文件中可能存在多个操作是对主文件中同一个记录进行的。
批处理的时间分析:
假设主文件中含有n个记录,事务文件中含有m个记录,则对事务文件进行排序的时间复杂度为O(mlogm);内部归并的时间复杂度为O(m+n),则总的内部处理的时间为O(mlogm+n);
假设对外存进行一次读/取为s个记录,则整个批处理过程中读/写外存的次数为
2(((m/s(+((m+n)/s()
12.3 索引文件
一、结构特点:
1.索引文件由“主文件”和多级“索引”组成。
2.索引中的每个记录(索引项)由“关键字”和“指针”组成。
3.通常,索引文件中的主文件是无序文件,索引是 (按关键字有序)的有序文件。
4.“索引”是在输入数据建立文件时自动生成。初建时的“索引”为无序文件,经过排序后成为有序文件。
二、操作的特点:
1.检索方式为:直接存取和按关键字存取。“检索”将分两步进行:先查索引,然后根据索引中指针所指索取记录。
2.插入记录时,“记录”插入在主文件的末尾,而相应的“索引项”必须插入在索引的合适位置上。因此,最好在建索引表时留有一定“空位”。
3.删除记录时,仅需删除索引表中相应的索引项即可。
4.更新记录时,应将更新后的记录插入在主文件的末尾,同时修改相应的索引项。
三、“索引”的结构
1.多级静态索引
此时的索引文件结构:
第三查找表
( ( ( ( ( (
第 二 查 找 表
( ( ( ( ( (
查 找 表
( ( ( ( ( (
索 引 表
( ( ( ( ( (
主 文 件
对主文件中每个记录建立一个索引项:
主关键字 记录在主文件中的存储位置
称作稠密索引,由这些索引项构成索引表;
从索引表建立的索引称查找表,其中每个索引项为:
最大关键字 其所在数据块的存储位置
称这类索引为非稠密索引。类似地,由查找表建立的索引为第二查找表;由第二查找表建立的索引为第三查找表。
按关键字进行检索时,从第三查找表开始,至多访问外存五次。
2.动态索引
索引
您可能关注的文档
最近下载
- 2025村委换届考试题及答案.docx VIP
- 2024《小红书运动户外行业白皮书》.docx
- 推荐浙江省土建安全技术资料台帐(十二本).doc VIP
- 基于ABAQUS的橡胶材料粘弹性特性仿真.docx VIP
- 肠套叠护理PPT课件讲解PPT课件.pptx VIP
- (沪教版2024)二年级数学上册新教材解读课件.pptx
- 小儿肛管排气.pptx VIP
- 新解读《GB_T 5271.9 - 2001信息技术 词汇 第9部分_数据通信》最新解读.docx VIP
- 新解读《GB_T 18492-2001信息技术 系统及软件完整性级别》最新解读.docx VIP
- PPT灌肠操作及并发症处理.pptx VIP
文档评论(0)