The-Anatomy-of-a-Large-Scale-Hypertextual-Web-Search-Engine[译文].docVIP

  • 6
  • 0
  • 约1.67万字
  • 约 19页
  • 2018-01-10 发布于江西
  • 举报

The-Anatomy-of-a-Large-Scale-Hypertextual-Web-Search-Engine[译文].doc

The-Anatomy-of-a-Large-Scale-Hypertextual-Web-Search-Engine[译文].doc

大型超文本网络搜索引擎的剖析 Sergey Brin和Lawrence Page Computer Science Department Stanford Unversity, Stanford, CA 94305, USA sergey@和page@ 摘要: 本文介绍了一个在超文本中广泛应用的大型搜索引擎Google的原型。Google的设计使之能够高效地抓取网络信息并为之建立索引,它的查询结果比现存的其它系统都要更令人满意。这个原型的全文和至少含有2千4百万个页面的超链接数据库可以从/下载。设计一个搜索引擎是一项富有挑战性的工作。搜索引擎要为上百亿包含等量的不同词汇的网页建立索引。它们每天要接受上亿次的查询。尽管大型的搜索引擎在网络上是非常重要的,但是在学术上却没有多少对它的研究。另外,由于技术的突飞猛进和网页量的剧增,在今天要搭建一个网络搜索引擎比起三年前是大有不同的。本文对我们的大型网络搜索引擎提供了一份深层次的介绍──据我们所知,这是公开发表的论文中第一篇描述得如此详尽的。除了在把传统搜索技术应用到如此数量级的数据中遇到的问题以外,还有一些新的技术上的挑战,比如利用超文本中的附加信息来改善搜索结果。本文将着手解决这个问题,如何搭建一个实用的大型系统来发掘超文本中的附加信息。我们还将要关注如何有效地处理无组织的任何人都能随意发布任何信息的超文本数据集。 关键词

文档评论(0)

1亿VIP精品文档

相关文档