基于Google的大规模搜索引擎的架构和设计技术-计算机应用技术专业论文.docxVIP

  • 7
  • 0
  • 约3.5万字
  • 约 96页
  • 2019-01-04 发布于上海
  • 举报

基于Google的大规模搜索引擎的架构和设计技术-计算机应用技术专业论文.docx

基于Google的大规模搜索引擎的架构和设计技术-计算机应用技术专业论文

∥46.1619摘 ∥46.1619 摘 要 本文提出了一个大规模搜索引擎的改进框架,充分利用了超文本 的结构,这个结构设计用来有效的爬行和索引网页。产生比现行系统 更加满意的搜索结果。这个结构有一个至少拥有2400万页的全文超链 接库,这个库可以在http://google.stanford.edu/中得到。【设计~个搜索 引擎是一件相当难的工作,搜索引擎每天都要搜索成千上万的网页, 对成千上万的搜索请求做出反应。虽然大规模的搜索引擎技术是非常 重要的,但是有关这方面的研究并不多,而且由于技术的进步和网络 的迅速增长,搜索引擎的设计所面对的需求与环境与三年前大不相同 了√本文先是讨论了~个大规模搜索引擎的设计和实现,并且简要的 描述了一些关键性技术,象中文分词技术、网络排序技术、图形链接 技术、大规模网页索引技术、网络存储技术等,最后本文构造了一个 改进型的大规模搜索引擎框架。本文除了把传统的搜索引擎技术扩展 到适应于大规模的数据出现的问题外,还提出了一些新的技术问题, 以便使用超文本附加信息,生成更好的搜索结果。 女 关键词:万维网,搜索引擎,索引,Google嫂索21勘信息搜索,网页 排序,中文分词 Abstract In this paper,we present improved architecture of large·scale search engine whic

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档