- 1
- 0
- 约1.71千字
- 约 15页
- 2017-08-27 发布于上海
- 举报
一种问答式检索系统布尔查询生成方法 何靖 北京大学网络与分布式实验室 2006.07 大纲 背景介绍 信息检索(IR)和问答系统(QA) 问答系统的模块 查询生成方法研究 调整式查询生成方法 初始化查询 查询调整 实验设置和结果 小结和展望 背景介绍—IR v.s. QA 信息检索 关键词查询?文档集合 信息需求?关键词查询? 文档集合?所需信息? 问答系统 自然语言描述的信息需求 精确的答案 背景介绍--问答系统模块 问题分析 指代消解,问题分类,问题目标 文档/段落检索 文档检索模型 查询生成 检索排序 答案抽取 精细实体识别 通过关系抽取 模式匹配 背景介绍—问答系统中查询生成 传统方法 方法:问句出现词去停用词直接检索 问题: 查询过紧或过松 导致查全率或查准率的大幅下降 基于模式重写对查询扩展 方法:训练匹配模式,进行查询扩展 问题: 需要大量问题答案对数据,数据稀疏问题 调整式查询生成—概要 目标 提高检索效果:查准率和覆盖率 提高检索效率:少的查询次数 基本形式 合取范式 基本过程 初始化查询 查询调整 调整式查询生成--初始化查询 命名实体和专有名词(BASELINE) BASELINE + 普通名词 BASELINE + 普通动词 BASELINE + 普通修饰成分 调整式查询生成-- 查询调整(1) 设置合法区间 检索获得文档数的范围:既不太多,也不太少
原创力文档

文档评论(0)