上海海大图书馆2010秋研究生中文数据库信息检索讲座(精品·公开课件).ppt

上海海大图书馆2010秋研究生中文数据库信息检索讲座(精品·公开课件).ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
上海海大图书馆2010年秋研究生资源利用讲座资料 上海海事大学图书馆 海大图书馆中文数据库信息检索 主讲:上海海事大学许忠锡 xuzhongxi28@ 信息检索系统基础知识 信息检索系统的核心和概括,主要由文献信息资源库和资源索引构成。 文献信息资源库:即文献信息资源描述体序列,由文献信息资源描述体按照一定的描述规则描述信息资源以及一定的顺序对信息资源排列组成文献信息资源集合。 文献信息资源索引:即文献信息资源标识序列,由文献信息资源的标引标识按一定顺序排列而组成的集合。检索的实现就依赖于此。 构成信息检索系统的条件 为能实施信息检索,信息检索系统必须具备如下条件: (1) 详细描述与著录文献信息资源的外部与内容特征; (2) 具有既定的检索标识,可以是检索点中任何内容,作为检索标识; (3) 依据已经描述出的信息资源的标识,对信息资源进行科学合理的排列,形成文献信息资源库; (4) 依据信息资源的描述结果与检索点,提供各种检索途径。 检索语言的种类 检索语言主要有外表特征语言、内容特征语言两大种类。 1.外表特征检索语言从信息表现出的外在特点对信息资源进行描述,从外表途径对信息资源进行组织。用户从所能感知到的信息资源外在特征,进行信息的检索。 2.内容特征检索语言主要从信息的内容着手,对信息资源、文献信息内在的内容特征进行描述,对信息资源、文献信息从内容角度上进行组织。用户从所需信息的内容入手,用内容特征检索语言表达信息内容特征概念,形成内容特征的检索策略,并实施从信息内容特征为途径的信息检索。 1. 分类语言 其中最为常见的是等级体系型分类语言。就其对信息组织的功能而言,体系分类语言被应用对信息所含学科内容特征的组织。体系分类语言在计算机检索系统里,形成数据库中的分类检索途径的倒排文档。 2. 主题语言 其中常用的有标题词语言、叙词语言、关键词语言。主题语言可以用来进行信息主题内容的组织,形成信息主题索引等。在计算机检索系统里,形成数据库中主题检索途径的倒排文档。 主题语言的种类 1. 标题词: 所谓标题词,是指经过词汇控制、经过规范化处理的名词术语等自然语言,用来标引与检索文献信息的词或词组。标题词语言是一种先组配式语言。 2. 叙词: 叙词是指经过规范化处理的,以基本概念为基础的自然语言,用来标引与检索文献信息的词或部分词组。叙词语言是一种后组式语言。 3. 关键词: 关键词,是指那些出现在文献信息的标题、摘要、正文中,对描述文献信息主题内容具有实质意义的词语,亦即对提示和描述信息主题内容是重要的、带关键性的词语。关键词基本上不作规范化处理,或者仅是极少量的规范化处理。 信息检索过程 1.确定信息检索的途径 检索途径是用户与检索系统建立联系的中介,检索途径也称为检索点、检索入口。检索途径一般分为反映信息内容特征的途径与反映信息资源外表特征的途径。 内容特征检索途径 分类途径 信息组织原理中,给信息资源标引上分类标识,产生信息资源的特征点。利用这样的特征点进行信息检索,就是分类途径检索。利用分类途径检索时,能够检索到的信息都是属于这个学科,所以是学科族性检索。 主题途径 信息组织原理中,给信息资源标引上主题标识,产生信息资源的特征点与检索入口点。利用这样的特征点与入口点进行信息检索,就是主题途径检索。在利用主题途径检索时,能够检索到的信息都是属于这个主题内容的,所以主题途径检索是特性性检索。 外表特征检索途径 1. 著者途径 2. 题名途径 3. 序号途径 4. 引文途径 5. 其他途径 各类检索途径的组合选择 但在实施信息检索时,特别是在计算机检索系统中,往往将两种检索途径结合使用,其检索效果表现更加良好。 1. 内容特征结合外表特征的扩大检索 2. 外表特征结合内容特征的扩大检索 2.确定检索的限制条件 目的是优化检索结果。检索条件一般有: (1)受检信息的时间限制。 (2)检索词匹配方式限制。一般在中文计算机检索系统中常有对检索提问标识词匹配上的限制条件,即所谓检索词的精确匹配与模糊匹配。 外文检索系统中还有“”、{}、(W)、(N)、?等检索词匹配算符的应用,其主要目的也都是为了扩大、缩小检索范围,提高检索的效率。 (3)受检信息查询范围限制。 (4)受检信息语种与地区限制。 (5)输出信息排序限制。 3. 制定检索策略 所谓检索策略就是检索前制定的检索概念组配和执行顺序的方案,检索策略更是表达用户具体

文档评论(0)

花好月圆 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档