第一届全国信息检索与内容安全学术会议
PAGE
PAGE 2
基金资助:本课题得到国家自然科学基金和教育部归国留学人员科研基金资助。作者简介:吴友政
基金资助:本课题得到国家自然科学基金和教育部归国留学人员科研基金资助。
作者简介:吴友政,安徽,博士生,email: yzwu@;赵军,山西,副研究员,博士,email: jzhao@;
段湘煜,河南,博士生,email: xyduan@;徐波,浙江,研究员,博士, email: xubo@
吴友政,赵军,段湘煜,徐波
(中国科学院自动化研究所 模式识别国家重点实验室,北京 100080)
TREC、NICIR和CLEF等评测的成功已经证明:系统化、大规模的定量评测对问答系统的研发有巨大的推动作用。然而,缺乏汉语问答系统评测机制已经成为制约汉语问答技术发展的主要障碍。本研究小组在吸收英文、日文等问答系统评测的成功经验基础上,推出面向汉语的问答系统评测平台(Evaluation Platform for Chinese Question Answering,简称EPCQA),并规划了汉语问答系统评测的几个阶段。除此之外,本文还对EPCQA语料库(1.8GB互联网网页)、测试集(从多种不同的途径收集了4250个基于的事实用户提问)、打分标准(MRR、准确率、召回率和F值)等构建过程进行了详细的介绍。
汉语问答系统;评测
Building an Evaluation Platform for Chinese Question Answering Systems
Youzheng Wu Jun Zhao Xiangyu Duan Bo Xu
(National Laboratory of Pattern Recognition, Institute of Automation, CAS,
The success of TREC, NICIR, CLEF and etc has proved that systematical and large scale evaluation will accelerate the research on Question Answering (QA). Unfortunately, no evaluation mechanism has become the main handicap to the research and development of Chinese QA systems. Based on the experiences from previous evaluation systems, we built an evaluation platform and presented the roadmap for Chinese Question Answering. The paper introduces in detail the process of building the evaluation platform, which is composed of the corpus as the primary source of answers(1.8GB from Web), the test question set (4250 test questions via multi-approaches), and the evaluations in terms of MRR, precision, recall and f-measure.
Chinese Question Answering; Evaluation
引言
所谓问答系统,是指系统接受用户以自然语言形式描述的提问(例如:世界上最大的宫殿是什么宫殿?),并从大量的异构数据中查找出能回答该提问的准确、简洁的答案(例如:“紫禁城”或者“故宫”)的信息检索系统。因此,问答系统与根据关键词检索并返回相关文档集合的传统搜索引擎有着根本的区别。它能够向用户提供真正有用、精确的信息,将是下一代搜索引擎的理想选择之一。经过这几年的发展,自然语言问答系统已经成为自然语言处理领域和信息检索领域的重要分支和新兴研究热点。
在问答系统的研发进程中,系统评估对于系统的研发和应用有显著的影响。几年来,“通过系统化、大规模的定量评测推动研发向前发展”的研究方法和技术路线受到越来越多的研发人员的重视,例如国际上著名的TREC (Text Retrieval Conference),MUC(Message Understanding Conference),DUC(Document Understanding Conferen
您可能关注的文档
- 普通高等学校本科专业设置管理规定-重庆工商大学派斯学院高招网.doc
- 曲线轮廓光壁喇叭天线设计与分析-易迪拓培训.pdf
- 机床筹轨用含磷耐磨铸铁的研究.pdf
- 机械设计制造及其自动化专业本科人才培养方案-机电工程学院.pdf
- 机电一体化专科-宜春广播电视大学.doc
- 材料制备工艺的计算机模拟木-金属学报.pdf
- 柴油/掺水乙醇二元燃料燃烧特性研究-农业机械学报.pdf
- 楼国泰买了-陆家嘴国泰学习网-cathaylife-elearning.ppt
- 模糊控制理论在电脑话务员中的运用-福州大学学报.pdf
- 欧姆电阻器电阻.ppt
- 25-26学年政治(部编版)选择性必修第二册课件:第1单元 周清1 民法中的人身权及财产权.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.4.1 权利保障 于法有据.pptx
- 2025北京丰台区高二(上)期中地理(A卷)含答案.docx
- 2025北京三帆中学初三(上)开学考英语试题含答案.docx
- 2025北京一零一中初三9月月考语文试题含答案.docx
- 2025北京海淀区初三(上)期中道法试题含答案.docx
- 2025北京丰台区高一(上)期中政治(A卷)含答案.docx
- 25-26学年政治统编版必修4课件:3.3 唯物辩证法的实质与核心.pptx
- 25-26学年政治统编版必修4课件:7.2 正确认识中华传统文化.pptx
- 湖北省部分高中2026届高三上学期二模联考 历史试卷.docx
最近下载
- 附录B规范性附录AGC性能指标计算及补偿-中国电力企业联合会.DOC
- 山东省烟台市蓬莱区2022-2023学年六年级上学期期末数学试题(五四学制) (含答案解析).docx VIP
- YQ-15-烟用材料许可使用物质名 单系列标准.pdf VIP
- 2019-2020学年四川成都锦江区五年级上册语文期末试卷及答案.pdf
- 基于ABAQUS的动力总成悬置支架仿真分析方法研究.docx VIP
- 【三套试卷】【浙教版】小学三年级数学上册第一单元教材检测题附答案.pdf VIP
- EMT会议管理制度.docx VIP
- 十年(2016-2025)高考物理真题分类汇编(全国通用)-专题23 法拉第电磁感应定律.docx VIP
- 渠道维护工高级技师考试答案(强化练习).docx VIP
- 动量和能量中的滑板块模型专题.docx VIP
原创力文档

文档评论(0)