2015信息检索知识.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、信息检索(Information Retrieval ) 包括两个部分: 一是信息存储,即把大量分散的无序的信息集中起来,经过加工,使之有序化、系统化,成为有功能的检索工具或检索系统。 二是信息检索,利用已组织好的检索工具或检索系统,按照课题的要求将所需信息查找出来。 信息检索类型,分为: 数据检索(Data Retrieval)--特定的数据 事实检索(Fact Retrieval)--特定的事实 文献检索(Document Retrieval)--特定的文献 是根据课题的要求,采用科学的方法,利用专门的检索工具,如书刊或数据库,从大量的文献资料中找到所需文献的过程。 包括,书目检索、题录或索引检索、文摘检索、全文检索。 二、检索原理与检索语言 1 、检索原理 是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。 存储过程--对文献进行标引 检索过程--根据需求,确定提问式 2 、检索语言(检索标识,Retrieval Language) 检索语言是一种在文献存储和检索过程中共同使用的语言。它的用途是描述文献特征,表达情报提问,并使两者能相互沟通。 可分为规范化语言(受控语言)和非规范化语言(自然语言)。 规范化语言:是指对文献检索用语的概念加以人工控制和规范,把检索语言中各种同义词、多义词、近义词、同形异义词等进行规范化处理,使每个检索词只能表达一个概念。 例:《IM》的Subject Index;《CA》的CS、GS;《中目》的分类目次 非规范化语言:它对检索用语中的各种同义词、多义词、近义词、同形异义词等不加处理,所以也叫自然语言,如关键词。 例:《CA》Keyword Index 三、常用文献检索算符 逻辑“与” and /* 检索式“A and B”表示文献中同时包含检索词A和检索词B的文献才是命中文献。 如:查找“胰岛素治疗糖尿病”的检索式为 insulin (胰岛素) and diabetes(糖尿病)。 逻辑“或” OR/+ ??? 检索式“A or B”表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。 如:查找“肿瘤”的检索式为cancer(癌) or tumor(瘤)or carcinoma(癌) or neoplasm(新生物)。 逻辑“非” NOT/- ??? 检索式“A not B”表示包含检索词A同时不包含检索词B的文献为命中文献。 如:查“动物的乙肝病毒(不要人的)”的文献的检索式为hepatitis B virus(乙肝病毒) not human(人类)。 邻近度算符 With ??? 检索式“A with B”表示检索词A和检索词B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才是命中文献. 如:“drug with abuse”检索出的是同一个字段中同时出现这两个词的记录。 邻近度算符Near ??? 检索式“A near B”表示检索词A和检索词B不仅要同时出现在一条记录的同一字段里,还必须在同一个子字段(一句话)里的文献才是命中文献。 如:drug near abuse检索出的是同一句话中同时出现这两个词的记录。(也可说成是两个词之间没有句号的文献)。 邻近度算符Near# 其中“#”代表一个常数,检索式“A near# B”表示检索词A和检索词B之间有0~#个单词的文献(A和B在同一记录、同一字段里)。在near后加一个数字,指定两个词的邻近程度,且不论语序 。 如:information near2 retrieval表示检索词 information和retrieval同时出现在一个句子中,且这两个检索词之间的单词数不超过两个的那些文献为命中文献。 四、文献检索工具的含义和类型 1 、检索工具的定义与特点 定义:检索工具(Retrieval Device)是指用于报道、存储和查找文献的工具。它具有存储(编制过程)和检索(查找过程)两大职能。 特点:(1)收摘一次文献、(2)著录文献特征、 (3)提供多种检索手段 2 检索工具的类型 *按摘录方式划分如下: 目录 题录或索引 文摘 全文 目录(Catalogue) 含义: 目录是对文献的外表特征的著录。它通常以完整出版物(如一本书或一种刊或一个会议录的名称)作为著录的基本单位来报道和记录文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。 按职能划分目录种类: 出版发行目录 馆

文档评论(0)

5f2e576 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档