倒排文档的一般文件结构 —以Lucene为例.pptVIP

  • 13
  • 0
  • 约 14页
  • 2016-11-13 发布于江苏
  • 举报

倒排文档的一般文件结构 —以Lucene为例.ppt

倒排文档的一般文件结构 —以Lucene为例.ppt

倒排文档的一般文件结构 ——以lucene为例 重要概念 整体结构 segment内部结构 重要概念 Field:Field的概念与一般数据库中的字段的意义相同,表示要存储的数据的某一个字段属性 STORE属性:标示了这个Field的数据是否需要被完整存储 INDEX属性 :标示了这个Field的数据是否需要被索引 重要概念 Term:Term是索引文件的最小存储单位,它由Field名称、Field值和Field属性3部分组成 Document:一个Document由若干Term组成,它是索引文件的基本读写单位。 整体结构 每个索引文件都由两部分文件组成,一部分是全局数据,另一部分被称为segment。其中,每个索引文件可能包括一个或多个segment,每个segment就是一个小的索引文件 整体结构 全局数据主要有3部分组成: segments文件:记录了该索引文件中有多少个小索引(segment)组成,每个segment的名称和所包含的Document数量。 lock文件 deltable文件,Win32系统用于保存将要被删除但还没有被删除的文件信息 索引优化合并 segment内部结构 一个segment由多个文件组成,总体来讲可以分为字段文件、词典文件和因子文件三类文件 字段文件 字段文件由1个字段信息文件和两个存储字段文件组成

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档