信息检索教程 第2版 高职高专教材 肖亚明 张兵 课题二信息检索基础理论新.ppt

信息检索教程 第2版 高职高专教材 肖亚明 张兵 课题二信息检索基础理论新.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课题二 信息检索基础理论 1、教学内容 (1)信息检索的概念、特点、类型 (2)信息检索的基本原理 (3)信息检索语言的概念及类型 (4)信息检索系统的概念、基本类型、结构 (5)信息检索的方法、步骤、评价 2、重点、难点 重点:信息检索的基本原理 难点:信息检索的方法、步骤、评价 3、教学基本要求 (1)了解信息检索的概念、特点、类型 (2)掌握信息检索的方法、步骤、评价 第一节 信息检索概述 一、 信息检索及特性 1.信息检索涵义 信息检索(Information Retrieval),亦称情报检索、文献检索。 信息检索就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。 信息检索包括两个层次的涵义:信息的存储和信息的查找。即包含了广义的信息检索和狭义的信息检索。 本章所讲的主要是狭义的信息检索,即信息的查找过程。 信息检索的要领 What? Where? How? 2.信息检索特性 ① 信息检索的相关性 相关性表明用户是否认为一文献与一提问吻合。 ② 信息检索的不确定性 标引(见下页)和检索词选用存在不确定性 ③ 信息检索的逻辑性 标引:通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献内容的过程。主要指选用检索语言词或自然语言词反映文献主题内容,并以之作为检索标识的过程。 标引举例 阿斯匹林引起胃溃疡 分类标引:R573.1 溃疡病 主题标引:阿斯匹林/副作用 消化性溃疡/化学诱导 二、信息检索的类型 1. ①按照检索对象的内容可分为数据信息检索、事实信息检索及文献信息检索。 设计人行天桥的参考文献有哪些 属于文献检索 “世界上最长的斜拉桥是哪座 ?该桥位于什么地方? 何时建成? ” 属于事实检索 某一新型载货汽车的载重量是多少 ?百公里油耗是多少 就属于数据检索. 2.按照存贮载体及检索手段方式可分为手工检索、机械检索及自动化检索。 三、信息检索的作用 ①有利于减少课题的重复研究、提高科研成功率 ②有助于节约时间、提高科研效率 ③有利于培养复合型、开拓型人才 三、 信息检索的基本原理 信息检索的基本原理即检索者的检索提问词与存储在检索系统中的检索标引词进行匹配对比、取得一致,即为检索命中,命中结果可从检索系统中以各种方式输出。 信息检索原理图* 第二节 信息检索语言 一 、检索语言及特征 1.检索语言概述 检索语言是一种专门用于各种手工和计算机化的文献情报检索与存贮系统、用以表达文献主题概念和研究课题主题概念的人工语言,亦可称为索引语言、标引语言、文献工作语言等。 如《中国图书馆图书分类法》、《中国科学院图书分类法》、《INSPEC叙词表》等都是检索语言,其分类号或检索词就是检索语言的词语。 检索语言词义单一性,可以保证表达概念的唯一性,进而保证了标引与检索的一致性。 检索语言作为标引人员与检索人员的共同语言 2.检索语言的特征 检索语言是连接信息用户、信息工作人员及信息资源的非常重要的一环,因此具有鲜明的特征。它必须满足以下三个基本条件: ①必须具有必要的语义和语法规则; ②必须具有表达概念的唯一性; ③必须具有将检索标识和提问特征进行比较和识别的方便性。 二、 检索语言的基本类型 检索语言按描述文献的有关特征,可分为描述文献外表特征的语言和描述文献的内容特征的语言。 1.分类语言 (1)体系分类语言。体系分类语言是一种直接体现分类等级概念的标识系统。它以科学分类为基础,以文献内容的学科性质为对象,运用概念的划分与概括的方法,按照知识门类的逻辑次序,从上到下、从总到分,进行层层划分。分类表则是这种语言的具体体现。 (2)组配分类语言。它用科技术语进行组配的方式来描述文献内容。如印度阮冈纳赞的《冒号分类法》(Colon Classification,CC)。 (3)混合分类语言。它是组配分类和体系分类语言的结合,两者有所侧重,因而又有组配体系分类语言和体系组配分类语言之分。如《国际十进分类法》(Universal Decimal Classification,UDC) 例:《中图法》是一部大型综合性图书分类法,其分类表也称主表,由五个基本部类、二十二个基本大类、简表、详表和复分表组成。 ①基本部类和基本大类。基本部类,又称基本序列,由五大部类组成。基本大类,又称大纲,是在基本部类的基础上展开的第一级类目,由22个大类组成。 ②简表 是在基本大类上展开的二级类目表,

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档