最新信息检索基础理论山东师范大学管理科学与工程学院.ppt

最新信息检索基础理论山东师范大学管理科学与工程学院.ppt

最新信息检索基础理论山东师范大学管理科学与工程学院.ppt

2 信息检索基础理论 山东师范大学管理与经济学院 本章要点 2.1 信息检索的基本原理 通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 存储是为了检索,检索又必须先进行存储。 信息检索的基本原理 计算机信息检索原理 示意图 2.1.2 信息检索的相关性问题 定义:检索结果与用户需求一致性程度 影响因素: 用户信息需求的表达 相关度判断的算法 用户的主观判断 手检相关性、机检相关性 “相关性”(relevance),是指信息检索系统针对用户的查询(query)从文档集中检出的文档与查询之间的一种匹配关系。 现代信息检索以自然语言文本为对象,从严格意义上讲,文档与查询之间不再是数据库检索中的那种简单的匹配关系。但“匹配”这一术语一直在使用,这里也接受这种说法。 手检相关性 依赖于用户智能 知识结构、项目进展阶段、用户心理、认知行为、认知能力 提高手检相关性的方法: 分析概念及学科属性;对检索工具的了解 调整检索策略 机检相关性 系统相关性 (1) 词频方法 (2) 位置方法 (3) 引用率方法 (4) 点击率方法 (5) 分类或聚类 用户相关性 (1) 基于词频统计的相关性 当用户输入检索词时,搜索引擎去找那些检索词在文章(网页)中出现

文档评论(0)

1亿VIP精品文档

相关文档