- 7
- 0
- 约7.8千字
- 约 43页
- 2017-11-28 发布于湖北
- 举报
网络内容安全3
倒排索引(续) 通常采用变长表方式 磁盘上,顺序存储方式比较好,便于快速读取 内存中,采用链表或者可变长数组方式 存储空间/易插入之间需要平衡 * Dictionary Postings 按docID排序 (原因后面再讲) Posting Brutus Calpurnia Caesar 1 2 4 5 6 16 57 132 1 2 4 11 31 45 173 2 31 174 54 101 词典 倒排(记录)表 倒排记录 Tokenizer 词条流 Friends Romans Countrymen 倒排索引构建 Linguistic modules 修改后的词条 friend roman countryman Indexer 倒排索引 friend roman countryman 2 4 2 13 16 1 待索引文档 Friends, Romans, countrymen. 词条化工具 语言分析工具 索引构建过程: 词条序列 词条,docID二元组 I did enact Julius Caesar I was killed i the Capitol; Brutus killed me. Doc 1 So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious Doc 2
您可能关注的文档
最近下载
- (正式版)DB44∕T 2770-2025 《城镇开发边界内详细规划数据库技术规范》.pdf VIP
- 中国大学mooc《审计学基础(南京审计大学) 》满分章节测试答案.doc VIP
- 口蹄疫课件(共43张PPT)《动物疫病防治》.pptx VIP
- 东软飞利浦高频高压发生器服务手册正文.pdf VIP
- (6.4.7.2)--缺锌与儿童疾病相关性研究进展.pdf VIP
- 湖南省长沙市第一中学2026届高三下学期4月阶段检测(第九次月考)语文试卷(含答案).docx VIP
- 河北工程大学毕业设计(论文)撰写规范.docx VIP
- 动态网络下基于节点流行度的潜在空间模型研究.pdf
- 中文释义 考研英语大纲词汇5500.xlsx VIP
- 空气压缩及变压吸附制氮资料.ppt VIP
原创力文档

文档评论(0)