[小学作文]数据库及其检索技术.pptVIP

  • 7
  • 0
  • 约6.44千字
  • 约 69页
  • 2018-02-28 发布于浙江
  • 举报
[小学作文]数据库及其检索技术

1.数据库及其类型 2.数据库结构 3.数据库检索技术 4.检索技术的应用 1.数据库及其类型 数据库是在计算机存储设备上按一定方式,合理组织并存储的相互有关联的数据的集合,是计算机技术和信息检索技术相结合的产物,是信息检索系统的核心部分之一。 按所提供的信息内容,数据库主要可分为参考数据库和源数据库。 ■参考数据库 存储一系列描述性信息内容,指引用户到另一信息源以获得完整的原始信息的一类数据库,主要包括书目数据库和指南数据库。 ?书目数据库 内容特征:存储描述如目录、题录、文摘等书目线索的数据库,又称二次文献信息数据库。如各种图书馆目录数据库、题录数据库和文摘数据库等属于此类。 作用:指出了获取原始信息的线索。 ?指南数据库 内容特征: 存储描述关于机构、人物、产品、活动等对象的数据库。 作用:指引用户从其它有关信息源获取更详细的信息。 ■源数据库 主要存储全文、数值、结构式等信息,能直接提供原始信息或具体数据,不必再转查其它信息源的数据库。 它主要包括全文数据库和数值数据库。 ?全文数据库 内容特征:存储原始信息全文或主要部分的一种源数据库。如期刊全文数据库、专利全文数据库、百科全书全文数据库。 作用:用户使用某一词汇或短语,便可直接检索出含有该词汇或短语的原始信息的全 文。 ?数值数据库 内容特征:存储以数值表示信息为主的一种源数据库,和它类似的有文本-数值数据库。 作用:数值数据库是对信息进行深加工的产物,可以直接提供所需的数据信息。如各种统计数据库、科学技术数据库等。 2.数据库结构 书目数据库的结构 书目数据库是以文档形式组织一系列数据,这些数据被称为记录,一个记录又包含若干字段。 ■文档 按一定结构组织的相关记录的集合。文档是书目数据库数据组织的基本形式,文档的组织方式与检索系统的硬件和软件功能密切相关。在书目数据库中,文档结构主要分为顺排文档和倒排文档。 ?顺排文档 记录按顺序存放,记录之间的逻辑顺序与物理顺序是一致的,是一种线形文档。顺排文档是构成数据库的主体部分,但其主题词等特征的标识呈无序状态,直接检索时,必须以完整的记录作为检索单元,从头至尾查询,检索时间长,实用性较差。 ?倒排文档 将顺排文档中各个记录中含有主题性质的字段(如主题词字段、标题字段、叙词字段等)和非主题性质字段(如作者字段、机构字段、来源字段等)分别提取出来,按某种顺序重新组织得到的一种文档。具有主题性质的倒排档,称基本索引档,非主题性质的倒排档,称辅助索引档。 顺排档和倒排档的主要区别 顺排档以完整的记录为处理和检索单元,是主文档,倒排档以记录中的字段为处理和检索单元,是索引文档。计算机进行检索时,先进入倒排档查找有关信息的存取号,然后再进入顺排档按存取号查找记录。 ■记录与字段 记录是作为一个单位来处理有关数据的集合,是组成文档的基本数据单位。记录中所包含的若干字段,则是组成记录的基本数据单位。在书目数据库中,一个记录相当于一条题录或文摘,因此,一个记录通常由标题字段、作者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字段等组成。按照字段所代表记录的性质不同,字段通常分为基本字段和辅助字段两类。 EI 数据库中的一条记录 Web of Science中的一条记录 3.数据库检索技术 是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息而采用的相关技术。主要有布尔检索、邻近检索、截词检索和限制检索。 ■布尔检索技术 ?逻辑与 概念:逻辑与是一种具有概念交叉关系的组配。 算符:“ * ” 、“ AND ” 、“并且”、“包含”等 举例:市场 * 预测 市场 AND 预测 市场 并且 预测 特点:增强专指度,表示市场和预测两个概念应包含在同一条记录中才算命中。 ?逻辑或 概念:逻辑或是一种具有概念相同、概念相关或概念并列关系的组配。 算符: “ + ” 、“ OR ”、“或者” 例如:查找用人工湿地处理废水方面的信息,有如下的概念并列或相关关系的表达: 废水处理系统、废水治理 、废液处理 、废液治理、污水处理系统、污水治理 人工湿地、人造湿地 用逻辑或可表达为: [废水处

文档评论(0)

1亿VIP精品文档

相关文档