- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎与网站目录的比较 网站目录中的网页是由专家人工精选得来,故网页内容丰富,学术性强。 分类浏览方式直观易用,适合多数网络用户和新手。 当用户检索目的不明确,检索词不确定时,分类浏览方式更为有效。 有较高的查准率。 检索过程不同 检索过程不同 网站目录首先给出广泛的分类主题,然后用户去选择需要的主题,接着找到更具体的主题,最终发现需要的信息。而使用搜索引擎的用户,首先需要有明确的检索词;其次要具备一定的检索知识,了解逻辑组配语法;最后还要了解每个搜索引擎的语法规则和检索符号的不同,这对非信息专业的用户有一定难度,而网站目录的分类浏览方式更适合普通因特网用户。 第三节 关于因特网上学术资源的利用问题 关于百度的文档搜索、文库、百度翻译等。 关于谷歌的学术搜索、图书、文件、翻译等。 ?布尔逻辑检索(Boolean) AND,OR,NOT + (AND) ,- (NOT) “All the words”(AND), “ And of the words”(OR) “精确匹配”(AND)、“模糊匹配” (OR) ?词组检索(phrase) 词组检索是将一个词组(通常用“”括起)当作一个独立运算单元,进行严格匹配,以提高检索的精度和准确度。实质接近“near”检索功能。几乎所有的搜索引擎都支持词组检索功能,并且都采用双引号来代表词组。如:“信息 教育”。有的如Ifoseek在词与词之间使用短横线“-”,如“digital-library-definition”,区别在于以“-”表示的词组不区分大小写。 ?截词检索(truncation) 截词法常有左截、右截、中间截断和中间屏蔽4种形式。而在搜索引擎中,目前多只提供右截法。而且搜索引擎中的截词符则通常采用星号*。如:educat *相当于education或educational或educator ?限制检索(字段检索)(fields) 限制检索就是限制检索词在数据记录中出现的区域。字段检索就是限制检索中最常见的一种,因为限制检索往往是对字段的限制。在搜索引擎中有限制检索的字段有以下几种: ? 主题字段:Title,Subject,Keywords,Summary ? 非主题字段:Image,Text ? 网络特征字段:主机名(host);域名(domain);链接(link);URL(site);新闻组(newsgroup);和E-mail等 ?位置检索(near) 在搜索引擎中,能提供位置检索的较少。如AltaVistta,目前只能提供临近位置计算(Near计算)。 例:“computer near 3 education”表示“computer”和“education”之间相隔两个词。 ?特殊检索功能 自然语言检索(natural laguage) 即直接采用自然语言中的字、词或句子作提问式进行检索。如可用“What is search engine?”; “ Who is Cliton?” 多种语言检索(mulitilanguage) 区分大小写的检索(case-sensitive) 主要搜索引擎介绍:概述 Internet搜索引擎就像信息海洋中的导航员,能帮助人们快速找到所需的信息。然而随着各种信息的巨量增长,人们使用搜索引擎也遇到了许多困难,相同的搜索词在不同的搜索引擎中得出不同的结果,在质量和数量上都有所不同。产生这种现象是因为不同的搜索引擎采集信息的方法、标引的内容以及检索功能是有所区别的。1994年4月,全世界第一个成功的搜索引擎WebCrawLer在美国的华盛顿大学诞生。 1996年开发出第一批中文搜索引擎,到目前已有中文搜索引擎282个,其中较完备的有131个。据Nature和Science的研究报告:2000年因特网有10亿个可搜索的网页,即使功能最完善的搜索引擎也只能找到Web页上1/3的网页;在8亿个网页中,Northern Light仅覆盖了16%,SNAP和AltaVista覆盖了15.5%,HotBot覆盖了11%,而当时世界上最大的搜索引擎FAST含3亿个网页。 主要搜索引擎介绍:简史 1. 萌芽: Archie、Gopher 2. 起步: Robot、Spider 3. 发展: Excite、Galaxy 4. 繁荣: Infoseek、Altavista、Goole和Baidu 关于Archie 时间、地点、人物:1990年,诞生于加拿大蒙特利尔(Mortreal)的麦吉尔大学,由Alan Emtage发明。 功能:自动索引互联网上匿名FTP文件。 应用:目前只有一个波兰的网站还在运
文档评论(0)