海量文档高速检索系统设计与实现.docVIP

  • 4
  • 0
  • 约3.02万字
  • 约 51页
  • 2018-11-03 发布于福建
  • 举报
海量文档高速检索系统设计与实现

XXX 硕士研究生学位论文 题  目:海量文档高速检索系统的设计与实现 姓  名: 学  号:        系  别: 信息科学技术学院   专  业: 计算机软件与理论   研究方向: 网络与分布式系统   导  师:   教授    二零零五年六月 版权声明 任何收存和保管论文各种版本的单位和个人,未经本论文作者授权,不得将本论文转借他人,亦不得随意复印、抄录、拍照或以任何方式传播。否则,引起有碍作者著作权益之问题,将可能承担法律责任。 摘要 搜索引擎的检索效率是评价搜索引擎质量的一个重要指标,面对互联网上信息量的不断增加以及搜索引擎网页库的不断增大,对检索系统性能要求也越来越高。本文详细介绍了一个搜索引擎检索系统的设计与实现,针对搜索引擎检索系统的性能问题进行了研究,讨论了影响检索性能的几个因素,并分别提出改进的方法和途径。这些方法包括设计出结构更加良好的倒排文件结构,改进整数压缩编码,引入倒排文件cache,预先计算关键词与文档相关度,减少关键词相对位置计算开销,改进站点聚类算法等。 另外,论文还阐述了系统中使用的新的相关度计算方法,这个算法使得在最终的结果排序上比原有系统有了一些改进。论文的组织形式以实际系统中各模块为主线,这些模块包括倒排文件结构,底层数据接口,查询,计分和站点聚类等。在论文最后给出了系统的综合测试结果

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档