信息存储与检索 作者 王知津 第2章.pptVIP

  • 34
  • 0
  • 约2.18万字
  • 约 107页
  • 2015-12-10 发布于广东
  • 举报
第二章 信息检索模型 本章目录 第一节 引言 任何检索策略都包含3个部分:文档表示、查询表示和匹配函数。文档表示反映文档在系统中的存储形式描述,可用一组关键词或标引词表示;查询表示反映对用户信息需求的描述;匹配函数用于将经过处理的文档表示和查询表示放入系统中进行匹配,以过滤输出结果。 信息检索系统的实现首先要对文档集进行索引和归档,以支持信息检索。检索式代表用户的信息需求。检索系统分析查询与文档表示,进行相似性匹配,排序返回查询结果。因此文档信息检索过程实际上涉及文档集的逻辑表示、用户查询表示、相似性匹配及其排序三个重要的处理。 第一节 引言 信息检索模型主要从两个方面抽象地研究信息检索方法:一是确定在检索模型中如何表示构成检索系统的两个要素,即文档和检索式;二是确定在模型中如何定义和计算文档和检索式之间的关系。 检索模型的重要作用主要体现在以下几个方面:更精确地描述出文档与文档、文档与查询间的相关关系,使之能比较和计算;安排更合理、更便于检索的文档存储形式;在此基础上设计出合理的检索方式;除信息检索外,进行一些信息辅助分析工作。 传统的信息检索模型(又称经典信息检索模型)包括布尔模型、向量空间模型和概率模型。 第一节 引言 信息检索模型到底是什么?其描述如下: 信息检索模型是一个四元组/D,Q,F,R(qi, dj)/: (1)D是文档集中的一组文档逻辑视图(表

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档