- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息存储与检索 多重表文件 第三十页,共四十六页。 信息存储与检索 建立多重表索引 ?????????? 第三十一页,共四十六页。 信息存储与检索 建立倒排文件索引 ?? ???? 第三十二页,共四十六页。 信息存储与检索 (2)倒排文件的查询 倒排表的主要优点是:在处理复杂的多关键字查询时,可在倒排表中先完成查询的交、并等逻辑运算,得到结果后再对记录进行存取。这样不必对每个记录随机存取,把对记录的查询转换为地址集合的运算,从而提高查找速度。 例:要找出所有工资级别小于13的硬件人员,则只需将工资级别倒排表中的次关键字为10,11和12的物理地址集合先做“并”运算,然后与职务倒排表中的硬件人员的物理地址集合做“交”运算:{108}∪{102,106} ∪{101}) ∩{101,102,107,110}={101,102} 即符合条件的记录,其物理地址是101和102。 第三十三页,共四十六页。 * * 信息存储与检索 第六章 文件组织与文件格式 第一页,共四十六页。 信息存储与检索 第六章 文件组织与文件格式 6.1 外存数据的组织 6.2 常用文件的组织 6.3 超文本与流媒体 6.4 图形文件与其它文件格式 第二页,共四十六页。 信息存储与检索 6.1 外存数据的组织 6.1.1 两类外存数据 1、文件 文件组织中的数据的结构组织方式一般可分为两类:流式文件和记录文件。 流式文件是数据的序列集合,可以看成是数据的字节流。 记录文件是逻辑记录的集合,记录是按存储数据在逻辑上的独立含义来划分的一个数据结构单位。 文件组织方式的基本特征是,用逻辑记录的定义来实现信息实体组成属性的数据联系。而文件和文件之间可能存在的联系只能依靠用户程序对这些文件的处理逻辑来体现。 第三页,共四十六页。 信息存储与检索 6.1、外存数据的组织 数据库文件 数据库中的文件是性质相同的记录的集合。数据库中所研究的文件是带有结构的记录集合,每个记录可由若干个数据项构成。 数据库中的记录是文件中存取的基本单位,数据项是文件可使用的最小单位。数据项有时也称为字段或者称为属性,其值能唯一标志一个记录的数据项或数据项的组合者称为主关键字项。 第四页,共四十六页。 信息存储与检索 【例】下表是一个简单的职工文件。每个职工情况是一个记录,它由7个数据项组成。其中职工号可作为主关键字项,它能惟一标识一个记录,即它的值对任意两个记录都是不同的。姓名、性别等数据只能作为次关键字项,因为它们的值对不同的记录可以是相同的。 第五页,共四十六页。 信息存储与检索 6.1 外存数据的组织 6.1.2 记录式文件的基本属性 1、组织形式 记录式文件是记录值的集合,记录值在文件物理存储空间上的存放模式称为文件组织形式。 一方面组织形式涉及文件的物理结构;另一方面在用户的语言界面上文件的组织形式又作为一种逻辑属性来定义,用户按对外存数据的存取要求来选择文件的组织形式。 第六页,共四十六页。 信息存储与检索 常用的文件组织形式 顺序文件 索引文件 相对文件 散列文件 第七页,共四十六页。 信息存储与检索 6.1.2 记录式文件的基本属性 2、存取方式 顺序存取方式:沿某种含义的序列,从序列的指定位置开始依次地存取每一个后继记录。 随机存取方式:指定记录值的某种标志,按标志存取特定的一个记录。 3、驻留介质 文件的组织形式和驻留介质有制约关系,如磁带文件、打印机文件、卡片文件只能是顺序文件。磁盘文件可以使用各种组织形式。 第八页,共四十六页。 信息存储与检索 4、处理方式??? 文件上检索和更新操作,都可有实时和批量两种不同的处理方式。 ① 实时处理:响应时间要求严格,要求在接受询问后几秒种内完成检索和更新。 ② 批量处理:响应时间要求宽松一些,不同的文件系统有不同的要求。? 【例】一个民航订票系统,其检索和更新都应当实时处理;而银行的账户系统需要实时检索,但可进行批量更新,即可以将一天的存款和提款记录在一个事务文件上,在一天的营业之后再进行批量处理。 6.1.2 记录式文件的基本属性 第九页,共四十六页。 信息存储与检索 6.2 常用文件的组织 6.2.1 顺序文件 1、定义及使用特点 顺序文件是指按记录进入文件的先后顺序存放,其逻辑顺序和物理顺序一致的文件。 “逻辑顺序”是指写入的顺序依次为第一个,第二个等; “物理顺序”是指实际存放在外存中的位置依次排在第一个记录,第二个记录等等。 只有顺序文件有这个二者一致的特点:先进先出,后进后出,且先进者排在前。 顺序文件的记录没有标志,可以不等长,从顺序文件中读记录,必须从第一个记录读起,不能从中间记录读起。 第十页,共四十六页。 信息存储与检索 6.2.1 顺序文件
您可能关注的文档
最近下载
- 国开电大学习网《农业推广》形考任务答案终结性考试调查报告答案.pdf VIP
- 工业机器人系统操作员(技师)理论复习考试题库资料(附答案).pdf
- 职业学校班主任能力比赛培训方案.doc
- 2025年钛铁合作协议书.docx
- 第三单元第1课 标志设计 教学设计 2024——2025学年人教版(2024)初中美术七年级上册.docx VIP
- 市委统战部部长在学习教育读书班关于加强作风建设研讨发言交流材料.docx VIP
- 国有企业合规管理体系建设指南(2025版).pdf VIP
- 科学探究活动中“问题链”的设计.pptx VIP
- 公安警察院校招生政审表.doc VIP
- 2025年麻醉科考试题库汇总含答案.docx VIP
文档评论(0)