基于块最大索引的剪枝算法.docx

PAGE 127 博士研究生学位论文 题目:搜索引擎中索引剪枝的研究 姓 名: 单栋栋 学 号: 院 系: 信息科学技术学院 专 业: 计算机系统结构 研究方向: 搜索引擎和网络信息挖掘 导师姓名: 李晓明 教授 二0一三 年 五 月 版权声明 任何收存和保管本论文各种版本的单位和个人,未经本论文作者同意,不得将本论文转借他人,亦不得随意复制、抄录、拍照或以任何方式传播。否则,引起有碍作者著作权之问题,将可能承担法律责任。 ?  PAGE 131 ? 摘要 搜索引擎作为人们获取网络信息的主要入口,正在被越来越多的人使用。不断增长的网页数量和查询请求量使得搜索引擎面临着巨大的性能挑战。通常,搜索引擎每秒需要在数百亿的网页数据上处理成千上万的查询。因此,如何高效地处理查询一直是搜索引擎和信息检索领域中重要的研究问题。 本文从索引剪枝的角度出发来研究提升查询处理效率的方法。索引剪枝通常分为静态索引剪枝和动态索引剪枝的方法。静态索引剪枝方法主要用在索引构建阶段。它在索引构建时,去除索引中一些对查询不重要的信息来缩短倒排链长度,减小倒排索引的大

文档评论(0)

1亿VIP精品文档

相关文档