- 4
- 0
- 约1.01千字
- 约 37页
- 2016-12-30 发布于重庆
- 举报
Chapter 4 搜索引擎索引 陈珂锐 chenke0616@163.com 计算机与信息工程学院 快讯 5500万美元融资后,知乎联合搜狗升级用户搜索体验 目录 1.单词词典 2.倒排列表 3.建立索引 4.动态索引 5.索引更新策略 6.查询处理 7.多字段索引 8.短语查询 9.分布式索引 1.单词词典 哈希加链表 树形结构 1.单词词典-哈希加链表 1.单词词典-树形结构 2.倒排列表(1) 2.倒排列表(2) 3.建立索引 两遍文档遍历法(2-Pass In-Memory Inversion) 排序法(Sort-based Inversion) 归并法(Merge-based Inversion) 3.建立索引-两遍文档遍历法 3.建立索引-排序法(1) 3.建立索引-排序法(2) 3.建立索引-归并法 4.动态索引 5.索引更新策略 完全重建策略(Complete Re-Build) 再合并策略(Re-Merge) 原地更新策略(In-Place) 混合策略(Hybrid) 5.索引更新策略-完全重建策略 5.索引更新策略-再合并策略 5.索引更新策略-原地更新策略 5.索引更新策略-混合策略 将单词根据其不同性质进行分类,不同类别的单词,对其索引采取不同的索引更新策略 将单词的倒排列表长度进行区分,长倒排列表采取原地更新策略,短倒排列表采取再合并策略。
原创力文档

文档评论(0)