(精)信息检索2——最新.pptVIP

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课题二 信息检索基础理论 主要内容 信息检索的概念和类型 信息检索的基本原理 信息检索语言的概念和类型 信息检索系统的概念和基本类型 信息检索的方法、途径和评价 信息检索的步骤 第1节 信息检索概述 一、信息检索含义 1950年,美国数学家莫尔斯(Calvin N.Mooers)首次提出“信息检索(Information Retrieval)”一词。 1、检索的意义 信息具有共享性,信息资源共享(information resource sharing)是当今社会的一个热点问题。为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息源中去识别和获取所需要的那部分信息,这个过程就是检索(searching)。 信息的检索、利用和创造是一个循环和增值的过程,人们通过工具(数据库)检索获得信息,经过处理筛选出需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具(数据库),再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。 信息检索定义 “信息检索”:从信息集合中迅速、准确地查找出所需信息的程序和方法。 信息检索特性 ① 信息检索的相关性 相关性表明用户是否认为一文献与一提问吻合。 ② 信息检索的不确定性 标引和检索词选用存在不确定性 ③ 信息检索的逻辑性 信息检索的类型 ①按照检索对象的内容可分为数据信息检索、事实信息检索及文献信息检索。 设计人行天桥的参考文献有哪些 属于文献检索 “世界上最长的斜拉桥是哪座 ?该桥位于什么地方? 何时建成? ” 属于事实检索 某一新型载货汽车的载重量是多少 ?百公里油耗是多少 就属于数据检索. 信息检索的类型 2.按照存贮载体及检索手段方式可分为手工检索、机械检索及自动化检索。 手工检索多以书本式或卡片式检索工具为主,手工检索需要了解标引规则,检索者根据文献标引规则查阅有关文献。 计算机检索就是将大量的文献资料或数据进行加工整理,按一定格式存贮在机读载体上,建成机读数据库,利用计算机对数据库进行检索的信息检索方式。 信息检索的类型 3、按照按系统中信息的组织方式划分全文检索、超文本检索、超媒体检索 全文检索是指检索系统中存储的是整篇文章乃至整本书。 超文本检索是对每个节点中所存的信息以及信息链构成的网络中信息的检索。 超媒体检索是对存储的文本、图像、声音等多种媒体信息的检索。 信息检索的作用 ①有利于减少课题的重复研究、提高科研成功率 ②有助于节约时间、提高科研效率 ③有利于培养复合型、开拓型人才 信息检索原理图* 第2节 信息检索语言 一 、检索语言及特征 1.检索语言含义 检索语言一般指文献标引和检索所使用的一种专门语言,是用以表达概括文献特征和检索课题内容特征的概念及其相互关系的一种概念标识系统。 即在存储时用以描述文献信息的内容和外部特征,而在检索时则用以表达提问的语言。 分类语言 等级体系分类语言 等级体系分类语言是一种直接体现分类等级概念的标识系统。 体系分类语言根据一定的观点,以学科分类为基础以文献内容的科学性为对象,运用概念的划分(缩小)与概括(扩大)方法.按照知识门类的逻辑次序,从总到分,从简单到复杂,进行概念的层层划分。 每划分一次,就产生一些类目,逐级划分,就产生许多不同级别的类目。 《中国图书馆分类法》是典型的等级体系分类语言。 书刊的排架 图书馆书刊排架按索书号排列,索书号由分类号和著者号构成 索书号的构成(分类号+著者号) 《信息检索概论》祁延莉编. G252.7/Q231 《2005建筑制图》曾维富, 陈良 等编著. TU204-39/Z053 《台球速成:新编》张宝荣编著 G893/Z107 主题语言 (1)关键词语言 关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。 以关键词作为文献内容标识和检索入口的检索语言就叫作关键词语言。关键词不受词表控制,适合于计算机自动编制各种类型的关键词索引。 主题语言 (2)纯自然语言 纯自然语言完全使用自然语言,即对一条完整的信息中任何词汇都可以进行检索。它采用全文匹配法检索,主要运用于计算机全文数据库和网络信息检索。 第三节 信息检索系统 一、检索系统的概念 检索系统是用以存储和检索文献线索或报道、累积和查找文献线索的工具,它是在一次文献的基础上经过加工、整理、编辑形成的二次文献。 按正文的内容性质划分,信息检索系统的基本类型有目录、题录、索引、文摘等类型。 索引(Index) 索引(Index)是揭示具有重要检索意义的内容特征标识或外部特征标识,按照一定顺序

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档