第二十三章 网络信息检索基础知识杨青兰州大学图书馆查新中心2011.3.ppt

第二十三章 网络信息检索基础知识杨青兰州大学图书馆查新中心2011.3.ppt

  1. 1、本文档共144页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
导 言 文献检索是一门既古老又年轻的学科 ?? 约4000年前,人类就开始有目的地组织信息,一个典型的例子就是图书中的目录。 ?? 随后,逐渐出现索引的概念,即从一些词和概念指向相关信息或者文档的指针。 到了1948年,C. N. Mooers在其MIT的硕士论文中第一次创造了“Information Retrieval”这个术语。 文献检索是一门既古老又年轻的学科 信息检索发端于19世纪前期,主要以手工检索方式为主,其发展速度较为缓慢,检索效率普遍不高。到20世纪50年代,1951年世界上出现了最早的计算机系统,这可称得上是信息检索发展史上的一个里程碑。随着计算机技术的不断进步,进入 20世纪90年代,网络技术开始进入社会生活各个领域,计算机检索也逐步由脱机检索、联机检索发展到如今Internet环境下网络检索。 网络信息检索是文献检索面对的新课题 网络检索以其低廉的费用、迅速的存取等多种功能对传统的检索造成了强力的冲击,与此同时,一些新的理论、新的课题也应运而生,加速了现代情报学和信息学的发展。 网络信息检索是指对利用Internet信息发布技术,通过Internet发布的信息进行的检索,主要利用搜索引擎、网络机器人和门户站点等来完成。随着Internet的迅速发展,网上信息以爆炸性的速度不断丰富和扩展,其信息数量之大、类型之多,已经给人们的工作、学习和生活方式带来了巨大影响。 网络信息检索是文献检索面对的新课题 为了充分发挥网络信息的重要作用,并能迅速在上百万个网站中快速有效地查找到想要得到的信息,必须对网络检索的特性进行研究分析,并掌握网络信息资源的特点、基本方法和检索技巧与检索工具等重要内容。网络信息资源的分布主要以网站为单位,数以千计的网站在Internet上形成了犬牙交错的信息资源库。 网络信息检索是文献检索面对的新课题 因特网的发展,逐渐改变了信息资源原有的属性,将文献信息数字化、应用环境网络化、技术手段多媒体化;运用情报学的理论与方法组织无序的网络信息,为用户服务;研究中文数据库的组织与检索技术将是我国情报学界必须重视的问题。 网络信息资源开发利用是我国信息化建设的核心内容。在我国信息基础设施建设已初具规模的今天,网络信息资源建设显得极为重要与迫切。这需要情报工作者认真研究解决。 检索语言的含义 信息检索语言实质上是标引和检索之间的约定语言,是人与检索系统对话的基础。检索的匹配就是通过检索语言的匹配来实现的,使用检索工具和检索系统必须掌握检索语言,它是掌握和提高检索技能的基础。 检索语言的分类 人工语言 (规范语言) 和自然语言(非规范语言) 分类语言和主题语言 网络信息资源 一、网络信息资源的特点 二、网络信息资源的类型 三、常见网络数据库检索系统 一、网络信息资源的特点 总体来讲,网络信息资源相比其他信息资源具有如下主要特点 : 1.离散性与共享性 2.动态性和及时性 3.不均匀性 4.潜在的失控性 网络信息资源的特点 1.离散性与共享性 WWW是受TCP/IP支持的应用协议集,它采用HRL,HTM,HTTP和CGI进行信息定位、存取和显示。在静态上,WWW是一个全球范围内的相互链接的多媒体信息网,同时在逻辑上它也可被看作是用HTML书写的分布式超文本结构。这种超文本结构使得文档之间用热键连接,这种自由度使得信息交换与分享潜力无穷。也正是由于这种离散性,使得网络信息资源能为所有网络用户共享,这一优越性是其他信息资源所不具备的。 网络信息资源的特点 2.动态性和及时性: 网上信息资源的瞬息万变,极其丰富,信息的更新也很迅速。 3.不均匀性 有两重含义,一是网络信息的质量不均匀,二是网络信息分布不均匀。 4.潜在的失控性 任何个人团体只需具备上网条件能够使用HTML,就可以把任何信息放到网上,这种信息经过种种检索工具的标引,就可供用户检索,中间没有任何形式的质量控制,势必影响检索效果的查准率,从而导致检索效率的失控。 二、网络信息资源的类型 从文献信息检索角度看,我们可以把网络信息资源分成以下几种类型: 1、网上图书信息 2、电子期刊 3、专利信息 4、网上数据库 5、网上其它科技信息 1、网上图书信息 Internet上提供的图书信息主要包括书目信息和电子图书.这些信息我们可从以下几个方面来获取:   (1) 出版商提供的书目信息。国内外许多出版社都有自己的网站, 通过Internet发布其出版物的目录、最新图书内容简介、价格等信息。   (2) 数字图书馆提供的电子图书

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档