第6章 搜索引擎类型其评介.doc

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 搜索引擎类型其评介

第6章 搜索引擎类型及其评介 搜索引擎类型 1 搜索引擎的含义 搜索引擎(search engine)是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,将检索结果反馈给用户。它提供的是WWW上的主页,新闻组中的文章,软件的存放地址及其作者,某个企业或个人的主页等。 2 搜索引擎分类 2 1 按信息内容的组织方式划分 按信息内容的组织方式,可将搜索引擎划分为目录式搜索引擎和机器人搜索引擎。 2 1 1 目录式搜索引擎 目录式搜索引擎(directory,catalog)提供由网页作者所呈送的因特网资源的链接集合,同时对这些资源作出评价并组织成主题目录。 目录式搜索引擎有两种基本类型:一种是由主题专家日常建立和维护的学术性专业目录,以满足科研人员的需要;另一种是为普通大众和商人服务的商业目录。 由于不同的目录式搜索引擎在选择标准方面存在着明显差别,所以在使用时,一定要使用能确切满足自己真正需求的那种类型的目录式搜索引擎。 有相当一部分人没有充分使用目录式搜索引擎,却直接使用机器人搜索引擎。学术性专业目录所列出的网址,是经过仔细挑选和注释过的,有一定的质量保证,在使用因特网时,没有理由忽视目录式搜索引擎。当检索一个范围较广的题目,并希望浏览一下与该题目相关的、被推荐的网站时,目录式搜索引擎是会非常有用的。 Yahoo!(http://WWW./)是Web上最流行的目录式搜索引擎之一,是最大的商业目录,但对它的不足之处应有足够的认识。当使用Yahoo!检索时,检索到的仅是标题和简短的描述语;相反.机器人搜索引擎通常为用户作全文检索。Yahoo!倾向于索引 较大网站的网页,因此,任何重要的较小网站的网页也许会消失在Yahoo!上。 类似的还有:Galaxy(http://WWW./) 中文的搜狐(http://WWW.) 雅虎中国简体版(http:///) 雅虎中国繁体版(http://) 2 1 2 机器人搜索引擎 机器人搜索引擎(狭义的search engine,有时被称为检索型检索工具)不是靠人工发现和甄别信息,而是由一个被称作“蜘蛛,,(spider)的计算机程序在网中爬行,依据一定的网络协议在因特网中发现、加工、整理信息,并为用户提供检索服务。机器人搜索引擎由三部分组成:①“蜘蛛”,从一个网页到另一个网页地游遍Web,鉴别和阅读网页;②索引,含有一串由“蜘蛛”收集来的网页所组成的数据库;③检索机制,能使用户检索索引,并通常依命中相关程度的次序来排列结果,同时把结果返回给用户。当检索一个特定网站或检索的题目范围较窄时,使用机器人搜索引擎是非常恰当的。 重要的机器人搜索引擎有: AltaVista(), Excite(), HotBot(), Infoseek(). Lycos(), WebCrawler(); 中文的北大天网( /)等。 还有一个很特别的搜索引擎:/ 2 2 按专业范畴划分 按专业范畴,可将搜索引擎划分为综合性搜索引擎和专业性搜索引擎。 2 2 1 综合性搜索引擎 综合性搜索引擎主要以网页和新闻组为搜索对象,信息覆盖范围广,适用用户广泛,如Yahoo!,Altavista,Excite,Infoseek等。Infoseek除网页和新闻资源外,还收集FTP,Gopher资源。 2 2 2 专业性搜索引擎 综合性搜索引擎覆盖信息太广泛,专指性差,一些专门性的网络检索工具便应运而生,许多学科已出现了本专业的搜索引擎,如社会科学信息网关(Social Science Information Gateway,http://WWW.sosig.ac.uk)是有关社会科学信息资源的搜索引擎,它由信息检索、信息浏览、最新信息、添加新资源和帮助信息五大部分组成。医学专业的搜索引擎就有几十个,其中,医学世界检索(medical worldearch,http://WWW.mwsearch.com)是第一个医学领域的搜索引擎,它几乎囊括了网上重要的医学网站,并对其中挑选出的某些网页进行全文检索。它提供的简单检索能辨认美国国立医学图书馆医学词表中的主题词,并可自动扩大和缩小检索范围,高级检索能增加词表中的主题词或去掉不理想的主题词。 另有一些具有专门用途的搜索引擎,如Checkdomain(http://WWW.Check domain.com/)是专门的域名搜索引擎,利用它可以搜索世界大多数国家的域名注册情况; 电子邮件地址(E-mailaddresses,http://www.E-mailaddresses.com)和图片搜索(http://WWW.arrib

文档评论(0)

fpiaovxingl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档