[经济学]第2章 信息检索模型.pptVIP

  • 25
  • 0
  • 约1.27万字
  • 约 82页
  • 2018-03-09 发布于浙江
  • 举报
[经济学]第2章 信息检索模型

第二章 信息检索模型 内容提要 信息检索系统的形式化表示 布尔逻辑模型 向量空间模型 概率模型 其他检索模型 信息检索模型 信息检索模型是指如何对查询和文档进行表示,然后对它们进行相似度计算的框架和方法。 本质上是对相关度建模。 信息检索模型是IR中的核心内容之一。 信息检索模型 一个信息检索模型是由文档表示、查询、关系、模型框架构成的四元组。 四元组:System=(D,Q,F,R(dj,qi)) D 文档集的表示 Q 用户需求的表示 F 文档表示、查询表示和他们之间关系的模型框架(Frame) R(dj ,qi) 给出Query qi和Document dj 的评分 文档逻辑视图 D是一个文档集合,通常由文档逻辑视图来表示。可以是一组索引词或关键词。既可以自动提取,也可以是由人主观指定。 匹配处理框架(F) 在信息集合(D)与需求集合(F)之间建立模型化处理的框架与规则。 不同检索模型的匹配处理的数学机制是不同的。 布尔模型:集合论的基本运算 向量空间模型:多维向量空间理论和向量线性代数 概率模型:集合论、概率运算和Bayes法则 匹配计算函数R 匹配函数R(dj,q)用于计算任一信息dj(dj∈D)与任一提问q(q∈Q)形成的信息——提问对(dj,q)之间的相似度大小。一般地,R(dj,q)的函数值为一实数,其取值区间为[0,1] 匹配函数的特点

文档评论(0)

1亿VIP精品文档

相关文档