网站大量收购独家精品文档,联系QQ:2885784924

文献检索与利用1-2016本科课程.pdf

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文献检索与利用1-2016本科课程

第二章计算机信息检索  一 数据库结构  1、数据库定义:是满足一定需求而收集的有  序的信息集合。 2、数据库的类型  全文数据库  书目型数据库 (二次文献数据库)  词典型数据库  事实型数据库  多媒体数据库 3、数据库的构成  从使用者观点看,数据库主要由 “文档—记录— 字段”三个层次构成。  (1 文档  用户选择所需的联机系统数据库时,多数数据库 以单一的文档编号出现。此时文档的概念和数据库相 当。但有些数据库规模庞大,被分成若干个文档。  从数据库的内部结构来看从数据库的内部结构来看,,文档的概念是指数据文档的概念是指数据 库内容的组织形式。  (2 记录(records)  记录是文档的基本单元。它是对某一实体的全部 属性进行描述的结果。在全文数据库中,一个记录相 当于一篇完整的文献;在书目数据库中,一个记录相 当于一条文摘或题录。  (3 字段(fields)  字段是记录的基本单元。它是对实体的具体属性 进行描述的结果,即记录中的每个著录项目,在书目 数据库中,常见字段有:TI(题名)、 DE(叙词)、SU (主题词)、AB(文摘)、AU(著者)、AD(著者地址)、 YR(年)、LA(语言)  字段根据其描述文献特征的不同,可以分为两类:  ((11 基本索引字段基本索引字段 这些是描述文献内容特征的字段这些是描述文献内容特征的字段,, 如篇名、文摘、叙词、自由标引词 (关键词 等字段。  (2 辅助索引字段 这些字段描述的是文献的外表特 征,如著者、机构名称、语种、刊名、来源、出版年 等。 4、数据库的特点: 为了便于计算机在数据库中进行检索组配,每个 数据库都有一个顺排文档和多个倒排文档。 顺排文档:就是存入数据库的全部记录。是将数 据库的全部记录按照记录号的大小排列而成的文献集 合,它构成了数据库的主体内容。相当于印刷型检索 工具的正文部分。 倒排文档倒排文档::以记录的特征标识作为排列依据以记录的特征标识作为排列依据,,其其 后列出含有此标识的记录号。可分为二大类: 基本索引文档 (倒排文档1):从记录的基本 字段 (如:TI、DE、AB 中提取的检索词排列而成。 辅助索引文档 (倒排文档2):从记录的辅助 字段 (如:AU、LA、PY、 中提取的检索词排列而成。 二 计算机检索的主要检索功能 1.布尔逻辑检索功能  (1 逻辑 “与”  这种组配关系用 “AND”或 “* ”表示,国内数据库多用“并且”。  此运算用于提高检索结果的检准率。  A and B 或 A * B A or B 或 A + B  2 逻辑 “或”  用 “or”或 “+ ”连接检索概念,国内数据库多用“或者”。  可用其组配表达相同概念的检索词,如同义词、相关词等。  在检索中,此运算用于提高检索结果检全率。  (3 )逻辑 “非”  用 “not”或 “- ”连接检索概念,国内数据库多用“不包含”。  它用于在某一记录集合中排除含有某一概念的记录。  在检索中,此运算用于提高检索结果检准率 A not B 或 A - B  在以上的逻辑算符中,其运算优先级顺序为NOT、AND 、OR (有的数据库 无优先顺序)。可以用括号改变它们的运算顺序。   如:有A 、B、C、D 四个检索词,检索提问可以分步进行:  第一步:A OR B (结果为S1 )  第二步:C OR D

文档评论(0)

138****7331 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档