- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 15 卷 第 2 期 广 西 工 学 院 学 报 V o l 115 N o 12
2004 年 6 月 JOU RNAL O F GUAN GX IUN VI ER S IT Y O F T ECHNOLO GY June 12004
1004 6410 ( 2004 ) 02 0029 05
文章编号 2 2 2
Goog le 搜索引擎及其实现技术
唐培和 , 杨新伦 , 刘 浩
(广西工学院计算机系 , 广西 柳州 545006 )
摘 要 : 详细分析了 Google 搜索引擎的体系结构 、数据结构 、索引及其实现过程等技术 , 对学习 、借鉴 、研究搜索引擎
技术具有很好的参考价值 。
关 键 词 : Google ; 搜索引擎 ; 原理 ; 实现
: 302 7 :
中图分类号 T P 1 文献标识码 A
0 引 言
随着因特网的迅猛发展 、 信息的增加 , 用户要在信息海洋里查找信息 , 就象大海捞针一样 , 而搜索
W EB
引擎技术恰好解决了这一难题 。 因此 搜索引擎技术正成为计算机工业界和学术界争相研究 、开发的对象 。
,
始于 1994 年的分类搜索引擎 (Yahoo )
采用的是人工整理和登记信息的方法 。 第二
年基于全文检索的搜索引擎 A ltaV ista 亮相
了 它机械地收集大量的数据 然后以其中的
, ,
全部字符串为搜索对象 , 从而可以在分布于
全世界的庞大数据中查找到很多文件 。 数据
的“量”确保之后 , 接下来要追求的便是 “质”
了 , Google 的成功在于迅速地完成了由量到
质的转变 , 以其高质量的搜索服务及用户的
普遍认可取得了很大的成功 , 已成为互联网
行业成功的典范之一 。
1 Google 的体系结构
搜索引擎根据用户的查询请求 , 按照一
定的算法从索引数据库中查找相应的信息并
返回给用户 。 为了保证用户查找信息的精度
和新鲜度 , 搜索引擎需要建立并维护一个庞
大的索引数据库 。 搜索引擎主要由网
Google
图 1 Google 体系结构
( )
络蜘蛛 、索引 库 与搜索引擎软件等部分组
成 , 如图 1 所示 [ 1 ] 。
: 2004 03 15
收稿日期 2 2
基金项目 : 广西自然科学基金 ( 桂科自 0066006 ) 资助 。
( )
作者简介 : 唐培和 19642 , 男, 广西全州人 , 广西工学院计算机工程系副教授 , 工学硕士 。
? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.
30 广西工学院学报
文档评论(0)