第三章 信息检索概述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 信息检索概述

徐惠 前章回顾 (一)信息、知识、情报、文献的概念 信息(information):是事物存在的方式和运动状态及其规律的表征,是事物的一种普遍属性。 知识(Knowledge):是人类对各种大量信息进行思维分析、加工提炼,并加以系统和深化而形成的结果。优化和系统化了的信息即为知识。 情报(information) :能满足一定需求的、激活了的知识或信息。 文献(Document):记录有知识的一切载体。 (二)文献资源的类型、特点 按载体类型划分:印刷型、缩微型、声像型、电子型 按加工深度划分:一次文献、二次文献、三次文献 一次文献:首次加工而成的文字记载,是检索的目标。 二次文献:对一次文献进行再加工,形成的另一类新的文献形式,如目录、书目、文摘、索引,是检索的工具。 三次文献:利用、选择有关的一次文献再加以分析、综合编写文献形式。如年鉴、百科全书,是检索目标和检索工具。 按出版形式划分:十大信息源:图书、期刊 特种文献:会议文献、学位论文、专利文献、产品样本、标准文献、科技报告、档案文献、政府出版物。 第三章 文献检索的原理与方法 第一节 检索原理 第二节 检索语言 第三节 检索系统 第四节 检索技术 第五节 检索策略 第一节 文献检索的基本原理 一、 文献检索的含义: 将文献按一定的方式组织和存储起来,并根据用户的需要找出相关文献的过程。从广义上来说,包括文献的存储和文献的检索。 狭义的文献检索为“文献存储与检索”的后半部分,是指从文献集合中找出用户所需要的有关文献信息的过程,通常称为“文献查找”或“文献搜索” 。 (1)文献存储:利用一定的方法、规则和技术(主题词表或分类表)把大量分散的无序的文献组织起来,进行加工,使之有序化、系统化,形成检索途径,成为有功能的检索工具或检索系统;其过程包括对文献信息的著录、标引等。 文献存储:原始文献→分析文献特征→标引文献→存储 (2)文献检索过程:利用已组织好的检索工具或检索系统,按照同样的主题词表(或分类表)及组配原则分析课题,形成检索提问标识,根据检索系统所提供的检索途径,从文献信息集合中查获与检索提问标识相符的信息特征标识的过程。 文献检索:检索提问→检索标识→匹配→输出文献 二、文献检索原理: 抽象概括为:对信息集合与需求集合的匹配与选择 具体表述为:用户的需求特征与数据库中的每一条记录被标引出的特征进行比较匹配 所谓“匹配” ,就是将用户需求集合中的检索标识提交到检索系统中,与检索系统中存储的信息特征标识进行进行逐一比对,两者完全或基本一致时,即为检索命中信息,从检索系统中输出。 对于文本而言,最主要、最常用的匹配标准是由某个或若干个词汇表达的 “关键词”、 “主题”、“分类号”等,也就是检索语言。 第二节 文献检索语言 一、 文献检索语言: 是用来描述文献特征和表达信息提问,沟通信息存贮人员和信息检索人员双方思想的一种人工语言。 在文献存储过程中,用它来描述信息的内容和外部特征,从而形成检索标识; 在文献检索过程中,用它来描述检索提问,从而形成提问标识;当提问标识与检索标识完全匹配或部分匹配时,结果即为命中文献。 检索语言的功能 从检索的角度来说:检索语言实质就是检索途径(检索点)。 可分为:分类途径、主题途径、著者途径及其他途径。 三、 检索语言的分类 2. 根据描述信息特征的不同 (1)分类语言 类是指具有共同属性的事物的集合,“物以类聚”是人们长期以来认识事物的一种方法。 分类语言:是直接体现知识分类的概念标识系统,它将许多类目根据一定的原则组织起来,通过标记符号(分类号)来代表各级类目和固定其先后次序的。分类法按学科、专业集中文献信息,并从知识分类角度提示各类文献信息在内容上的区别和联系,提供从知识分类检索文献信息的途径。 分类表:分类语言的具体表现形式是分类表,信息检索系统中常用的分类表有: 国内: 《中国图书馆分类法》 (简称中图法) 《中国科学院图书馆分类法》(简称科图法) 《人民大学图书馆分类法》 (简称人大法) 国际 《杜威十进制分类法》(Dewey Decimal Classification,简称DDC) 《美国国会图书馆分类法》(Library of Congress Classification,简称LC) 分类表的作用:指导存储文献,正确标引出分类号;帮助从分类的角度检索某一类文献。 《中图法》: 《中图法》是《中国图书馆图书分类法》的简称,是我国目前通用的类分图书的工具。我校图书馆就是采用《中图法》来类分文献资料。 《中图法》基本结构: 《中图法》的标记符号采用英文字母与阿拉伯数字相结合的混合号码。即用一个

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档