- 15
- 0
- 约1.65万字
- 约 13页
- 2018-01-10 发布于江西
- 举报
大规模超文本网络搜索引擎剖析.doc
大规模超文本网络搜索引擎剖析
Sergey Brin and Larry page
概述
在这篇文章中,我们介绍Google,一个大规模搜索引擎的原型。Google被设计成未可以进行有效的网络抓取和索引并返回比现行系统更加让人满意的搜索结果。我们的这个原型包括索引了2千4百万页面的全文本和超链接的数据库,你可以通过来进行访问。对于一个计算机工程师来说,建立一个搜索引擎可以说是一项具有挑战性的任务,因为搜索引擎索引成百上千万页面的同时也涉及到了相同数量级别的关键词(Terms)。并且每天要回答超过1千万个查询请求。虽然,在当今网络中,搜索引擎的重要程度正越来越突出的显现出来,但是真正学术上的相关研究却很少。而且,随着科技的飞速发展和网络规模的不断扩大,在今天建立一个搜索已经和三年前大不相同了。这篇论文提供了关于如何创建一个大规模搜索引擎的深层次描述,这也是到目前为止我们所知道的第一篇在这一领域的论文。除了一些传统的数据级别相同的搜索引擎的技术,还有一些新的运用在超文本中旨在创建更为优化的搜索结果的技术。如何建立一个可以深度挖掘利用超文本中信息的大规模搜索引擎?这是本文提出的一个问题。同时,我们关注的另外一个问题是:对于那些不受传统格式限制的超文本,我们如何来进行处理?
关键词:
万维网(World Wide Web), 搜索引擎(Search Engines), 信息检索(Infor
您可能关注的文档
- Struts1之xml配置详解.doc
- The-Anatomy-of-a-Large-Scale-Hypertextual-Web-Search-Engine(中文版).doc
- The-Anatomy-of-a-Large-Scale-Hypertextual-Web-Search-Engine[译文].doc
- The-Anatomy-of-a-Large-Scale-Hypertextual-Web-Search-Engine完整中文翻译.docx
- tmj-web技术与应用课程设计报告.doc
- Tsung-测试XMPP-安装使用说明.docx
- Web2.0技术在教师专业发展中的典型应用研究.doc
- Web2.0技术大作业-博客系统报告文档.doc
- Web技术开发课程设计报告.docx
- web网页设计要点与课后答案.doc
- 2026年智慧健康管理系统创新报告.docx
- 河北衡水市武强中学2025-2026学年高二下学期4月期中物理试题(含解析).docx
- 2026年人工智能行业智能老年防走失定位器创新报告.docx
- 2026年低空经济飞行器量子技术应用创新报告.docx
- 2026年农业智能农业智能育种创新报告.docx
- 河北省保定市莲池区保定市第一中学2025-2026学年高二下学期期中考试生物试题(含解析).docx
- 2026年智慧城市电子站牌充电创新报告.docx
- 河北省邯郸市平恩中学等校2025-2026学年八年级期中考试英语试题(含解析).docx
- 2026年供应链创新技术应用报告.docx
- 2026年体育智能赛事管理系统支付系统创新报告.docx
原创力文档

文档评论(0)