- 6
- 0
- 约3.19千字
- 约 7页
- 2019-09-22 发布于北京
- 举报
PAGE
PAGE 1
中文问答系统中问题理解的算法研究
摘要:问答系统能够用准确、简洁的答案回答用户提出的问题。问题理解是其首要的分析工作。本文应用了基于规则的问题分类方法,提出了一种基于维基百科关键词扩展和基于同义词的关键词扩展相结合,并对问题中的关键词进行重要性标识的问题理解方法。实验结果证明,该方法对提高问题分类的准确率有较好的效果。
关键词:问答系统问题理解问题分类信息提取
中图分类号:TP391.1文献标识码:A文章编号:1007-9416(2012)12-0101-02
1、引言
自动问答系统是基于信息检索系统的高级形式,用户用自然语言描述的句子作为检索式,返回结果为用户所需问题的直接答案。问答系统主要包括三个部分:问题理解,文档检索和答案抽取。问题理解模块对问题进行分类的同时提取出关键信息;信息检索模块根据问题理解部分提供的关键词进行检索,找到相关的文本内容;答案抽取模块的主要工作是对检索的结果进行过滤,抽取问题的精确答案,而后对候选答案按相应的算法进行排序[1]。
其中,问题理解对自动问答系统的整体性能至关重要。首先,对用户所提问题分类,对于不同类型的问题,定制对应的信息检索和答案抽取规则;其次,分析问题,提取出问题的关键词。问题分类通常采用基于规则的问题分类方法和基于统计的分类方法[2]。基于规则的方法在问题的类别定义好后,相应
原创力文档

文档评论(0)