【企业导师】布尔检索模型索引构建.pptxVIP

  • 52
  • 0
  • 约8.28千字
  • 约 63页
  • 2018-05-02 发布于湖北
  • 举报

【企业导师】布尔检索模型索引构建.pptx

【企业导师】布尔检索模型

搜索引擎系统与应用 布尔检索模型 索引构建 主讲人:郭凯 2013-10-17;搜索引擎系统与应用 布尔检索模型;提纲 信息检索概述 倒排索引 布尔查询的处理;信息检索 从钱包里抽出一张信用卡是为了看到卡号以便输入,这个过程就是信息检索的一种形式 学术上定义信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 IR vs database: 结构化 vs 非结构化 结构化数据即指“表”中的数据 数据库常常支持范围或者精确匹配查询 。e.g., Salary 60000 AND Manager = Smith. 非结构化数据 通常指自由文本,没有清晰和明显的语意结构 允许 关键词加上操作符号的查询 更复杂的 概念性查询, 找出所有的有关药物滥用(drug abuse)的网页 经典的检索模型一般都针对自由文本进行处理 ;非结构化数据(文本) vs. 结构化数据(数据库);信息检索;布尔检索 针对布尔查询的检索,布尔查询是指利用 AND, OR 或者 NOT操作符将词项 连接起来的查询 信息 AND 检索 信息 OR 检索 信息 AND 检索 AND NOT 教材 2. Google的高级搜索?;词项-文档(term-doc)的关联矩阵;IR中的基本假设 文档集Collection: 由固定数目的文档组

文档评论(0)

1亿VIP精品文档

相关文档