第五讲 搜索擎检索.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络资源与信息检索 文献检索教研室 同学们提出常见问题: 本讲具体内容安排: 4.1 网络检索工具的类型 4.2 Web资源检索工具? 4.3 非Web资源检索工具? 4.4 搜索引擎介绍 4.5 检索实例 4.6 网络信息检索小结 互联网的出现是20世纪最伟大的科学成就之一,其发展速度远远超过世界上其他科学技术的发展速度。互联网与它所负载的海量信息,正在对社会经济生活、对人们的价值观念和生存方式产生着强烈的冲击。 随着互联网的发展,网上信息资源的数量、种类呈爆炸性增长,如何才能在浩如烟海的数字化、多媒体、非规范、跨时空、跨行业、跨语种的信息资源中快捷、准确地找出所需信息已成为一个突出的问题,用户迫切需要高效的检索技术和检索工具。 检索工具有哪些? 网络检索工具按照不同的划分方法,可分为许多不同的类型。 1、按索引方式:目录型、索引型搜索引擎。 2、按检索工具数量分: 独立型搜索引擎、集合型搜索引擎。 独立型搜索引擎它拥有自己的索引数据库,提供基于自身索引库的查询服务,如Google等。 集合型搜索引擎是多个独立型搜索引擎的组合也称多元搜索引擎、元搜索引擎,一般它没有自己的索引数据库,只提供集成的查询界面;如读秀(超星数字图书馆开发)等。 3、按检索网络资源传输协议分为: Web资源检索工具、非Web资源检索工具。 Web资源检索工具是以Web资源为检索对象,这是当前网上检索工具的主流几乎成了网络检索工具的代称。 非Web资源检索工具是查找网上非Web资源(FTP、Gopher、Usenet、Telnet等),如查找FTP资源的Archie、查找Telnet资源的Hytelnet等。 随着Web资源的迅速发展,非Web资源检索工具正在逐步Web化,使Web资源检索工具成为检索网络信息资源的集成化工具。 WorldWideWeb简称WWW或Web(环球信息网的缩写),中文称万维网,它采用超文本(Hypertext)、超媒体(Hypermedia)技术,集文字、图像、声音、动画等多媒体信息为一体,以直观的图形界面提供网络信息。WWW信息资源是互联网上最主要、最常见的信息资源。 一、独立搜索引擎 拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,国外具代表性的有Google、AllTheWeb等,国内著名的有百度(Baidu)等。 二、元搜索引擎 元搜索引擎 (Meta-Search Engine)  元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。 中文元搜索引擎中具有代表性的有比比猫(Bbmao)搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。 非Web资源检索工具(传统信息查询工具) 一、FTP FTP是文件传输服务,通过FTP不仅可以从远程计算机上获取、下载文件,也可以将文件从本地机上传到远程计算机上。通过FTP可获得电子图书、电子杂志、免费软件等许多类型的信息资源。 FTP资源分记名和匿名两种,最常用的是匿名FTP,即以anonymous或FTP作用户名,用E-mail地址或guest作登录口令,登录到远程计算机上,再利用那里的资源。这种匿名访问,一般被限制在公共目录下(Public或Pub),且不能上传文件,只能浏览、下载那里的资源。 二、Gopher 信息鼠(Gopher)是由美国明尼苏达大学在90年代初研究开发的一种基于菜单的网络信息系统,采用客户机/服务器模式。 Gopher还提供与 WWW、FTP、WAIS、Archie的连接。世界上许多Gopher服务器颁布在大学、公司或其他组织机构内,如资源目录/索引、图书馆目录及电子文献、公共数据库、单位简介及活动信息、生活信息、与其他Gopher服务器的连接等。 三、 Telnet 远程Telnet是Internet上较早使用的一种基本工具。它将用户注册到网上某一台主机上,使用户成为该主机的虚拟终端,共享该主机的资源和服务。例如图书馆联机公共检索目录也可通过Telnet来实现。应用Telnet还可再连接到另一台主机上去访问其资源。 Telnet的登录一般需要输入用户名和口令,最通用的是guest, public等。 Telnet曾经是Internet交通网络的主要部分,但现已被万维网替代。然而,仍有一些好的Telnet站点。 四、网络论坛 网络论坛是一种最丰富、最自由、最具开放性的网络信息资源。主要包括:新闻组(U

文档评论(0)

lanhe8975915 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档