开放域问答系统研究综述.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

开放域问答系统研究综述*

1.北京大学,信息科学技术学院,北京,100871;2.北京师范大学,管理学院信息管理系,北京,100875

E-mail:hj@,chenchong@,yhf@

摘要:尽管搜索引擎能够满足网络用户的很多信息需求,但是还有很多它无法满足。原因之一是它严

格的用户界面:它的输入是关键词,它的输出是相关文档集。对于很多信息需求,更加合适的提问和

回答方式是自然语言。开放域问答系统就是用于解决这一问题的。本文主要介绍开放域问答系统的系统

框架,主要技术和评测方法。

关键词:开放域问答系统;问题分析;信息检索;答案抽取

ASurvey:Open-domainQuestionAnsweringSystem

121

HEJing,CHENChong,YANHongfei

1(DepartmentofComputerScienceandTechnology,PekingUniversity,Beijing100871,China)

2(DepartmentofInformationManagement,BeijingNormalUniversity,Beijing,100875,China)

E-mail:hj@,chenchong@,yhf@

Abstract:ThoughWebuserscanfindrelativeinformationwithsearchengine,itcannotsatifyallinformation

needs.Onereasonisthatitsinterfacetousersisrigid:keywordsasqueryanddocumentsasoutput.However,for

someinformationneed,it’smoresuitabletobequeriedandansweredbynaturallanguage.Open-domainquestion

answeringsystemisdesignedtosolvethisproblem.Inthissurveypaper,wewillintroducetheframeworkand

criticaltechniquesforanopen-domainquestionansweringsystemandpresenthowtoevaluateit.

Keywords:Open-domainquestionanswering,questionanalysis,informationretrieval,answerextraction

1概述

1.1研究背景

随着网络数据的快速增长,从海量网络数据中获得相关信息成为一个巨大挑战,搜索

引擎在一定程度上解决了这个问题。在分析搜索引擎日志时发现,它包含一些自然语言表

述的查询如“如何安装RedHat9”。这表明互联网用户更加习惯于用自然语言来表达他们的

某些信息需求。搜索引擎的输入是一组关键词,但是有时用户的信息需求很难用关键词确

切地表达。同时,有时用户所需信息的粒度并不是一篇文档,而是一个描述性的段落、句

子、结论、人名或数字等,但是搜索引擎对于一个查询返回的是一个文档集合,用户还需

从中找出相关的内容。这表明现有的搜索引擎服务和用户的实际信息需求之间存在着两个

方面的“鸿沟”:系统要求的关键词表达方式与用户自然表达方式之间的鸿沟和系统返回信

*本文受到国家自然科学基金60933004),CNGI搜索引擎项目(CNGI2008-122),863课题

(2009AA01Z143),软件开发环境国家重点实验室开放课题(SKLSDE-2010KF-03)及973计划海量项目

(2005CB321901)的共同支持。

114

息的方式和用户需要返回的方式之间的鸿沟。如果能使用户以一种更加自然的方式和系统

交互

文档评论(0)

hcmpvg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档