第二章:信息检索基础.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 信息检索基础 2.1信息检索概述 2.1.1 信息检索原理 信息检索基本原理的核心是用户信息需求与文献信息集合的比较和选择,信息检索实质上是两者匹配的过程。 2.1.2 信息检索类型 2.1.2 信息检索的类型 数据检索:检索的结果是数据或数值。 如某种材料的电阻;某变压器的参数;化学分子式、数据图表等。手册 事实检索:检索的结果是事实结论。 查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的。<年鉴> 文献检索:检索的结果是文献资料。 查找相关文献的内容、出处、收藏单位等。如系统地查找数控机床相关方面的文献。<论文 > 文献检索是信息检索的核心部分。 2.1.3 信息检索的发展简要历程 手工检索阶段 世界四大检索工具(SCI\EI\ISTP\ISR),1665年《学者周刊》 计算机联机检索阶段 1965年ORBIT—DIALOG检索系统 网络检索方式 检索软件的开发 信息检索的未来阶段:智能化、高效化、人性化 2.1.4信息检索的意义 知识有两种,一种是我们自己知道的某主题的知识 ,而另一种则是我们知道什么地方能够找到知识的知识。 --赫伯特 2.2 信息检索途径 检索途径就是检索文献的出发点及路线,也称“检索点”。 信息检索与信息存储是互逆的过程,存储在检索工具和系统中的有些著录项或标引字段是可以提供检索的,这些著录或标引字段就是检索入口。 信息检索途径一般包括文献信息的内容特征途径和外部特征途径。 根据信息外部特征和内容特征的不同标识,检索途径可作如下划分: 分类途径 以学科性质和内容的相应类目、类号为特征标识的检索方法。分类途经检索与分类法是相对应的。 目前,我国通用的分类法主要有三种: A《中国图书馆图书分类法》(简称《中图法》) B《中国科学院图书馆图书分类法》(简称《科图法》) C《中国人民大学图书馆图书分类法》(简称《人大法》) 《中图法》简介 《中图法》有22个大类,分类号采用字母与阿拉伯数字相结合的号码;其中字母代表大类,数字代表大类下的细分。 《中图法》分类实例 主题途径 指用户根据所确定的主题词,利用主题词表和主题索引实施检索的途径。 特点 通过主题途径获取的信息专指性强,但查全率较低,对用户的检索知识要求很高。 主题途径实例 查看徐静蕾在新浪的博客 关键词途径 指用表达信息主题内容起关键作用的词组或单词实施检索的途径。 特点 关键词是一种很灵活的词组或单词,它不需规范化词表,使用比较方便。 关键词途径实例 小新想学习英语,希望在网上找些与他同样需求的人一起学习、交流。 2.3 检索语言 检索语言是用于描述信息系统中信息特征和表达用户信息提问的一种专门语言,是信息存储与检索共同遵循的规则。 2.4 计算机信息检索技术 计算机信息检索技术是用户信息需求和文献信息集合之间的匹配比较技术。 由于信息检索表达式是用户需求与信息集合之间匹配的依据,所以信息检索技术的实质是信息检索表达式的构造技术。 检索表达式是运用各种逻辑运算符号、位置逻辑算符、截词符、及其他限制符号等,把检索词连接组配起来,确定检索词之间的关系,准确表达检索课题的内容的算式。 2.4.1 布尔逻辑检索 布尔逻辑检索是用布尔逻辑算符将检索词、短语或代码进行逻辑组配指定文献的命中条件和组配次序用以检索出符合逻辑组配所规定条件的记录。是计算机检索系统中最常用的一种检索方法。 布尔逻辑组配是现行计算机检索的基本技术,主要通过“与(and,*)”、“或(or,+)”、 “非(not,-)”将检索词联络起来。  AND[*][][空格] A and B 逻辑与。A和B都为真时,结果才为真 ,即:A*B,逻辑含义用图表示是: OR [+][|] A or B 逻辑或。A或B中只要有一个为真时,结果就为真,即:A+B ?? ?? NOT[-][^][!]   A not B 逻辑非。A为真、B为假时,结果才为真,即:A-B 布尔逻辑运算符的运算次序 括号优先[与计算机编程中一样] (A OR B) AND C NOT D 不同的系统次序有差别,但总的来说一般次序为: NOT ? AND ? OR 例A:查找有关信息检索的非英文文献 信息[information] 检索[retrieval] 英文[english] (信息

文档评论(0)

xx88606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档