信息存储与索第3章.ppt

第三章 文本信息存储与检索 本章目录 第一节 引言 在用户需求的驱动下,信息检索始终处于动态演变的过程中。传统的手工检索采用人工匹配的方式,由检索人员对提问标识与文献标识进行比较,并做出文献选择。而计算机信息检索则是由计算机将输入的检索策略与系统中存储的信息特征标识及其逻辑组配关系进行类比、匹配的过程,它将人脑的过程显性化。 第一节 引言 无论是手工检索还是计算机检索,信息检索的过程实际上都是一个比较、匹配的过程,其本质是信息用户将自身的信息需求与信息集合进行匹配和选择。信息检索这一概念是基于这样的假设,即包含相关信息的文献或记录已经按照某种有利于检索的顺序组织起来了,因此为了实现有效的信息检索,首先需要对大量无序的信息进行收集、加工和存储,并用特定的标识系统描述信息获取的特征。在检索时,首先分析用户信息需求的内容,提取其中包含的概念或属性,并用与信息集合相同的标识系统将其表示出来,形成检索提问。如果检索提问与信息集合中信息的标识相一致,则属于检索“命中”,即找到了符合要求的信息。因此,计算机信息检索的基本原理仍是“匹配运算”,但是却不同于手工检索的“匹配运算”方式。 第二节 书目记录 3.2.1 书目记录结构 由美国国会图书馆主编的USMARC、国际图联主编的UNIMARC以及《中国机读目录格式》(CNMARC)都是对机读目录中格式的规定。其标准构成为:记录头标、地

文档评论(0)

1亿VIP精品文档

相关文档