第二章信息检索基础.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(二)数据库作为信息源的优势 1、于有专门的系统软件对数据进行存取、管理和加工处理等,因而可以使数据尽可能不重复(具有最小冗余度),而且人们可以随时将收集到的信息存入数据库,需要时方便地在数据库中查询; 2、相关信息质量好,信息集中、量大是数据库最大的优势。录。 3、以最优方式服务于一个或多个实用程序,因而数据可以共享; 4、数据库管理系统(DBMS)可以保证为用户数据安全保密,且当他们同时使用数据库时对数据提供保护; 5、信息更新速度快,动态信息库已达到日更新和时更新的程度,二次文献库的更新速度也比印刷型检索刊物快. 6、检索功能强。数据库检索途径远比手工检索工具多得多,检索效果也优于其他工具。 7、数据库检索速度快,检索操作简单,获取同量同质信息的价格要比其他检索工具便宜得多。 (三)数据库的类型。 按国际上通用的分类方法,数据库分为以下三大类: (1)参考数据库(Reference databases),是能指引用户到另一信息源获取原文或其他细节的数据库。 ①书目数据库(Bibliographic databases)是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。 ②指南数据库(Referral databases或Directory databases)也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类。 (2)源数据库(Source databases),指能直接提供所需原始资料或具体数据的数据库。它可以直接满足用户的信息需求。这类数据库包括: ①数值数据库 一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。 ②文本-数值数据库 一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。 ③全文数据库 一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。 ④术语数据库 一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。 ⑤图像数据库 一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、图片或照片等资料类型的计算机存储与检索。 (3)混合型数据库(Mixed databases) 能同时存贮多种类型数据的数据库。 (四)数据库的记录格式 数据库的记录是构成数据库顺排文档的基本单元,是对某一实体属性进行描述的结果。数据库中的记录往往是以字段作为基本著录单元,这些字段分为两类:一类反映信息主题内容的特征,提供从主题内容查找文献信息的途径,包括标题字段(TI)、文摘字段(AB)、叙词字段(DE)、自由词字段(ID)、分类代码字段(CC)等:另一类则是反映文献信息的外部特征的,提供从文献信息外部特征查找文献信息的途径,包括著者字段(AU)、信息来源字段(SO)、出版年代字段(PY)、语种字段(LA)等。 需要说明的是,不同的数据库(或系统)中,其记录字段的种类、数目、名称、代码不尽相同,在检索时需要查看有关的使用说明。 三、检索策略的表达 检索策略是用户检索思维和行为的集合,直接影响检索结果的好坏,因此,检索策略的准确表达是计算机检索的要点。 (一)检索式的拟订。检索式是用户检索基本要求的表达式,也是要求检索工具执行的检索指令的核心内容。最简单的检索式可以是一个词、一个字母、一个数字或符号,复杂的检索式至少是两个以上的检索项用各种检索算符联结构建而成。拟订检索式要注意检索词的准确性和检索词之间的逻辑关系。 【实例】“计算机网络安全防护”可以用检索式“计算机*网络安全*防火墙”来表达。 (二)常用算符与检索技术 计算机信息检索因为相关的信息量大,往往需要采用较多的检索策略才能达到满意的检索效果,而这些检索策略的运用中有些必须利用算符及相关的检索技术。常用的算符及相关的检索技术如下: 1.布尔检索 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。 ?下面以“计算机”和“文献检索” 两个词来解释三种逻辑算符的含义。 (1)“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档