大规模超文本网络搜索引擎剖析.docVIP

  • 15
  • 0
  • 约1.65万字
  • 约 13页
  • 2018-01-10 发布于江西
  • 举报
大规模超文本网络搜索引擎剖析.doc

大规模超文本网络搜索引擎剖析 Sergey Brin and Larry page 概述 在这篇文章中,我们介绍Google,一个大规模搜索引擎的原型。Google被设计成未可以进行有效的网络抓取和索引并返回比现行系统更加让人满意的搜索结果。我们的这个原型包括索引了2千4百万页面的全文本和超链接的数据库,你可以通过来进行访问。对于一个计算机工程师来说,建立一个搜索引擎可以说是一项具有挑战性的任务,因为搜索引擎索引成百上千万页面的同时也涉及到了相同数量级别的关键词(Terms)。并且每天要回答超过1千万个查询请求。虽然,在当今网络中,搜索引擎的重要程度正越来越突出的显现出来,但是真正学术上的相关研究却很少。而且,随着科技的飞速发展和网络规模的不断扩大,在今天建立一个搜索已经和三年前大不相同了。这篇论文提供了关于如何创建一个大规模搜索引擎的深层次描述,这也是到目前为止我们所知道的第一篇在这一领域的论文。除了一些传统的数据级别相同的搜索引擎的技术,还有一些新的运用在超文本中旨在创建更为优化的搜索结果的技术。如何建立一个可以深度挖掘利用超文本中信息的大规模搜索引擎?这是本文提出的一个问题。同时,我们关注的另外一个问题是:对于那些不受传统格式限制的超文本,我们如何来进行处理? 关键词: 万维网(World Wide Web), 搜索引擎(Search Engines), 信息检索(Infor

文档评论(0)

1亿VIP精品文档

相关文档