计算机学科导论第3章.pptVIP

  • 2
  • 0
  • 约5.7千字
  • 约 37页
  • 2017-06-11 发布于北京
  • 举报
* * * * * * * * * * * * * 信息检索原理与应用 * 搜索引擎的基本原理 信息检索原理与应用 * 预处理 构件文档集合的索引——倒排索引 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。 倒排索引被广泛用于搜索引擎系统对海量网页的存储,其效率要高于其它索引结构。 搜索引擎的基本原理 信息检索原理与应用 * 预处理 构件文档集合的索引——倒排索引 原始文档 文章1:Tom lives in Guangzhou, I live in Guangzhou too. 文章2:He once lived in Shanghai. 关键词 文章1:[tom] [live] [guangzhou] [i] [live] [guangzhou] 文章2:[he] [live] [shanghai] 搜索引擎的基本原理 关键词 文章号 [出现频率] 出现位置 guangzhou 1[2] 3, 6 he 2[1] 1 i 1[1] 4 关键词 文章号 [出现频率] 出现位置 live 1[2],2[1] 2, 5, 2 shanghai 2[1]

文档评论(0)

1亿VIP精品文档

相关文档