第二章__信息检索原理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章__信息检索原理

第二章 信息检索基础知识 主要内容 2.1 信息检索概述 2.2 信息检索原理 2.3 信息检索技术及其应用 2.4 信息检索策略 2.5 检索效果的评价 2.1 信息检索概述 2.1.1 信息检索的含义与实质 2.1.2 信息检索的重要意义和作用 2.1.3 信息检索的类型与特点 2.1.1 信息检索的含义与实质 广义:包括存储和检索两个过程。 存储:指依一定的要求把信息整序编排成文献集合体的过程,即编制检索工具和建立检索系统的过程。 检索:指利用编制好的检索工具和检索系统来查找所需文献的过程。 狭义:仅指后者。 1 信息检索的过程(广义的) (1)信息标引和存储过程 信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其他有意义的特征标识出来作为文献存储与检索依据的一种文献处理过程。 信息的存储过程主要是利用检索语言对文献信息进行标引,形成文献特征标识并输入检索系统,为检索者提供有规律的检索途径。 信息存储包括三个步骤。第一步是信息的选择与收集;第二步是信息的标引;第三步是形成大量有序可检的信息集合 。 (2)信息的需求分析和检索过程 信息的检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存贮所提供的检索途径,将检索提问标识与文献特征标识进行匹配,两标识相符或基本相符的则为命中的检索结果。 2.信息检索的实质 是将描述特定用户所需信息的提问特征,与信息存储的检索标识进行大小、异同的比较,从中找出与提问特征一致或基本一致的信息。 2.1.2 信息检索的重要意义和作用 1.充分利用信息资源,避免重复劳动 2.节省研究人员的时间 3.是获取新知识的捷径 2.1.3 信息检索的类型与特点 1.按检索内容分 1.数据检索(data retrieval) 是以数值或图表形式表示的数据为检索对象的信息检索,又称“数值检索”。 2.事实检索(fact retrieval) 是以事项为检索目的和对象的信息检索,又称“事项检索”。 3.文献检索(document retrieval) 是以文献为检索对象的信息检索。文献检索根据检索内容不同分:(1) 书目检索;(2)全文检索 2.按检索手段分 1.手工检索——即是用人工来处理和查找所需信息的检索方式。 2.计算机检索——是利用计算机和一定的通信设备查找所需信息的检索方式。 2.2 信息检索原理 2.2.1 信息检索原理 2.2.2 信息检索语言 2.2.3 信息检索系统 2.2.4 信息检索效率 2.2.2 信息检索语言 检索语言又称信息语言、检索语言、信息存储与检索语言、索引语言、概念标识系统等,是根据文献检索系统存储和检索文献时共同使用的一种约定性人工语言。应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。 检索语言是由符号、代码和词语组成的集合,其中,符号、代码是按学科门类严格编制的,词语是优选的、规范化的。 1.分类语言 分类语言是用分类号和相应分类款目来表达各种主题概念的,它以学科体系为基础,将各种概念按学科性质和逻辑层次结构进行分类和系统排序。 分类语言中最常见的是体系分类语言,它按照学科体系从综合到一般、从复杂到简单、从高级到低级的逻辑次序逐级展开。 分类表是体系分类语言的直观反映形式。 国内常用的分类法 《中图法》——中国图书馆图书分类法。1975年,第一版;1982年,第二版;1990年,第三版,1999 年,第四版。 《科图法》——中国科学院图书馆图书分类法。1958年正式出版,1959年增编索引。以自然科学分类见长。 《人大法》——中国人民大学图书馆图书分类法。1953年,第一版,1982年第五版。以社会科学分类见长。 《中图法》类目及标记符号 采用大写的汉语拼音字母和阿拉伯数字相结合的混合号码制度。 1.一级类目采用单独的大写的汉语拼音字母表示(A、B、Z等)。 2.二级类目(T工业技术类)采用两个大写的汉语拼音字母表示(TU、TP等)。 3.三级类目采用大写的汉语拼音字母和阿拉伯数字结合,如O12——初等数学。 4.四级类目以下表示方法:O151.26——线性代数的应用。 《中图法》 (1)3分法:根据毛泽东关于知识分类的论述,将人类知识分为哲学、社会科学、自然科学 (2)5大部类: A 马克思主义、列宁主义、毛泽东思想 B 哲学 C 社会科学 N 自然科学

文档评论(0)

cgtk187 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档