第1章信息检索基础知识.ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 以上文献类型中,除图书、期刊、报纸三种是人们生活中常见和常用的文献资料,由各种图书馆或资料室收藏外,其余的统称为特种文献,在收藏时另立体系,分别管理,如档案有专门的档案馆收藏整理。 * 目前,全世界每年出版各类期刊达15万种以上,科技期刊约占10 万种。我国现有期刊8000多种,其中科技期刊占54%。据统计,科研人 员从期刊中得到的信息约占70%以上,是十分重要的情报源。 * * 存储过程就是按一定的要求建成一个具有检索功能的数据库或检索系统的过程;而检索过程是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息的过程。 只有经过信息的有序存储才能提供检索。只有了解一个信息系统的组织方式才能找到其检索方法。 * * * * * * * * * 顺查适用于对某一课题的普查,能查找到相当长时间内发表的全部相关文献,所查到的信息资料比较全面,查全率较高,可揭示出检索主题的发展过程和规律。其不足是工作量大,费时费力。 倒查法适用于一些新课题、新观点、新理论、革新技术等信息资料的检索,重点查找近期的信息资料。其特点是查找信息资料速度快、效率高、省时,但其漏检率比顺变法高。 * 这种方法是针对单纯用引文法所获得的情报价值越来越小的缺点提出来的。按照引文规律,有价值的文献在发表后最初几年内被引用的次数较多,以后趋于减少。因此,追溯的年限应有限制。跳过追溯的那几年再用常规检索工具查出具有新价值的文献,然后再根据所附的参考文献追溯,并依次进行第三次或多次循环,直到获得的文献符合要求为止。 * 这种方法是针对单纯用引文法所获得的情报价值越来越小的缺点提出来的。按照引文规律,有价值的文献在发表后最初几年内被引用的次数较多,以后趋于减少。因此,追溯的年限应有限制。跳过追溯的那几年再用常规检索工具查出具有新价值的文献,然后再根据所附的参考文献追溯,并依次进行第三次或多次循环,直到获得的文献符合要求为止。 * * 1.3.2 检索语言的类型 1.根据检索语词的规范化程度,可分为: ①人工语言:又称规范化语言,是人为地对标引词或检索词加以控制和规范,使每一个词只能表达一个概念。这些语言经过规范化处理,词和事物之间具有一一对应的关系,排除了自然语言中同义词、多义词、同形异义词的现象 。 ②自然语言:自然语言是直接从原始信息中抽取出自由词作为检索词的检索语言。该语言对主题概念中的同义词、多义词等不加处理,取其自然状态,因此被称为自然语言。 * * 2.根据描述文献信息的特征分 检索语言的类型 描述文献外表 特征的语言 描述文献内容 特征的语言 题名 责任者 号码 文献类型 文献出版事项 分类语言 主题语言 标题词法 单元词法 叙词法 关键词法 引文语言 代码语言 分子式索引 合金号索引 * * 3.根据语言的结构原理分 (1)分类语言 分类语言是按学科范畴划分事物而构成的一种检索语言体系,它集中反映学科的系统性,反映事物之间的相关、从属、派生等关系,并从总体到局部分层、分面展开,最终形成分类体系。 目前,我国文献信息的分类与检索,主要根据三种分类语言,即《中国图书馆分类法》(简称《中图法》)、《中国人民大学图书馆图书分类法》(简称《人大法》)和《科学院图书馆图书分类法》(简称《科图法》) * * (2)主题语言 主题语言是直接以代表文献内容特征和科学概念的名词术语作为检索标识,并按字顺组织起来的一种检索语言。根据主题词性质不同,又可分为:标题词语言、单元词语言、关键词语言和叙词语言等。 * * ① 标题词语言:是从文献的题目和内容中抽取出来,经过规范化处理的主题语言。 标题词一般分为主标题和副标题,词表中按级一一列举各级标题,把主标题和副标题加以组配,作为标引和检索中使用的依据。 所谓标题词,它不是书名或篇名,而是事物定型的名称,如计算机、书、教育等。 * * ②叙词语言:是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言。 叙词语言以规范化的标引词形成词表,各词独立,标引时根据需要进行组配,可表达文献内容方面的复杂概念,适用于机检和手检; 叙词,国内亦称主题词,是经过规范化处理的、以基本概念为基础的表达文献主题的词和词组。 * * ③ 关键词语言:将文献中的一些主要关键词抽出作为检索标识,按字顺排列以提供检索途径的方法。 关键词是指从文献的题目、正文或摘要中抽出的能表达文献主题内容的具有实质意义的语词。 关键词语言没有经过处理,也不需要编制关键词表,凡是有意义的信息单元都可以用作关键词,是一种用自然语言做标识的检索语言,在计算机检索系统中应用较广。 * * ④ 单元词语言:是以单元词作为主题标识,通过字面组配的方式表达文献主题的一种主题语言。以文献

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档