西华师范大学信息检索课件1胡晓.ppt

西华师范大学信息检索课件1胡晓.ppt

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

超星数字图书馆(P99)

全球最大的中文数字图书网,40多万种电子书在线阅读、下载。;;书生之家

由北京书生科技有限公司创办,主要提供1999年以来中国大陆地区出版的新书的全文电子版。;第一章信息检索概述

第一节基本概念

第二节信息源

第三节信息系统;;信息检索(InformationRetrieval);;各学科领域层面信息按其内容性质分为理性信息和记述信息。

理性信息:即学术信息,是各学科领域信息的核心。学术信息的重要特征是:要进入相关学科问题研究,在学科不同层次的研究中产生的信息。

记述信息:描述性信息,对具体现象、事实(包括数据)进行记述或描述而产生的一种最基本、客观的信息。没有离开记述信息的所谓科学研究。;;;信息包含知识和情报。系列化的信息成为知识,知识中的特定需要部分就是情报。但也有的情报只是消息,并非知识。;文献:记录有知识的一切载体。包括图书报刊、声像资料、电子出版物。

资料:含有自己所需情报内容的那部分文献。

数据:原始符号,数字,文字。

;3.信息检索的分类;用手工方式来处理和查找信息。是一种传统而又基础的检索手段。

优点:

不需要特殊设备,查找方法简单,灵活。

不需要检索经费或费用较低。

缺点:

效率低,检索速度慢,大的课题相当费时。

在进行复杂问题的多途径检索时,需要反复查找若干检索工具。

查全率一般较低。;计算机检索;计算机检索的优势;光盘检索除可提供追溯检索、定题服务外,还用于自建库,检索费用较低。

优点

使用光盘检索不须通讯联系,不受时间限制。光盘可以替代或补充图书收藏,其多媒体的书籍、游戏和参考资料是用户最欢迎的类型之一。

光盘存储容量大,稳定性与数据保存性好,比较坚固耐用,而且结构小巧,性能价格比高。

缺点

信息获得比国际联机慢(回溯检索须多次换盘)

信息更新不及时;;;文献型信息检索

是以文献为检索对象的检索。凡查找某一主题、时代、地区、文种的有关文献,以及回答这些文献的出处和收藏处所等。;具体分为:;例:有关“太平天国的资料有哪些?”

;思路1:利用图书馆??源检索;;;思路2:利用各类搜索引擎;;思路3:利用数据库;;重庆维普(P117);布尔逻辑检索(BooleanLogic)逻辑检索是一种比较成熟,较为流行的技术,现代的情报检索系统多采用这种技术。

布尔逻辑运算符

逻辑与AND(*)

逻辑或OR(+)(l)

逻辑非NOT,ANDNOT(-);;信息全文检索:以查找到信息的全文为目的。;例:查找易中天发表的文章;;;四川省图书馆的入口

;;;数值型信息检索是以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等。

例:“长江有多长,洪水期最高水位有多高?”

使用年鉴、手册或专题数据库能获取这类信息。

;;;事实型信息检索利用检索工具或检索系统查找某一特定事物的过程。检索结果是有关某一事物的具体答案。

如:名词术语、概念、定义、某一事件、事实或某一机构、人物的状况等。

用于检索事实信息的检索工具有字词典、百科全书、年鉴、手册,以及术语型数据库和指南型数据库。;;二元论;EncyclopediaBritannicaOnline,简称EBOnline,作为第一部Internet网上的百科全书,1994年正式发布。可检索词条达到98,000个。EBOnline界面友好,简单易用。;;;;;4.检索语言;1)自然语言naturallanguage(非规范语言);自然语言;人工语言artificiallanguage(规范语言);分类语言和主题语言;;主题,通常指文献论述的对象,经过筛选后用以表述文献主题的语词,称为主题词。

主题语言,是规范化的检索语言,其检索词从相关主题词表中得出。一般指以表达文献主题内容的词语作为标引对象,按主题词的字顺组织文献,并用参照系统显示概念之间相互关系的文献信息组织与揭示的方法。

主题语言的依据是主题词表(又称叙词表,检索词表或词库),它是一些规范化的主题词及使用规则的集合体,是进行主题标引和主题检索的工具。

;;P14;关键词语言(keyword);优点:

1、简捷,降低对检索人员的要求;

2、易用,易于计算机编制和检索;

3、及时,能及时更新词汇。

缺点:

不规范,有大量的同义词、近义词,影响查全率和查准率。如“高速公路”有”autobahn”,“autoroute”,“freeway”,“speedway”,“thruway”等,“图形图像”和“图形图象”同义,检索时如果不能全部记住,会出现漏检;而“cell”既指细胞又指电池,检索时会出现误检。

不显示概念之间的关系,难以进行族性检

文档评论(0)

hylsx + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档