- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
面向开放域的中问答系统问句处理相关技术研究
博j论文 面向耳楠蛾竹巾更柏蒋系境问fq灶即锕廷}±术研究
中文摘要,
● 问答系统足信息检索分支,属于精确榆索,足田外信息技术的研究热点,但在
国内还处于起步阶段。信息检索是信息社会的重要特征,各种检索引擎对人们帮助
很大,但足如何使计算机更好地理解人的检索需求,如何获得精确检索结果,这些
目前还处于探索阶段,问答系统正是这个方面的毫要研究内容。本文系统地介绍了
问答系统的研究内容及现状,对中文问答系统与问句处理相关的关键技术进行了较
为深入的分析与探讨,实质性工作和创新点如下:
1)研究中文问答系统的理论框架和系统结构,从总体上对问答系统形成一个
较为清晰的认识,对其中的研究蓖点和难点进行具体的分析。
2)建立一个小规模的问句句法标注语料库(目前国内在该方面还足空白,没
有现成的资源呵资利用),在此基础上,研究相应算法,派生出句法截断数据库和
句法片段数据库,其中基于截断的片段和片段组合抽取算法具有很高的独创性和实
用价值。为高效地建立句法标注语料库,设计研发了一个实用的中文句法编辑与分
析辅助系统。
●
3)在标注语料库的基础上,根据中文问句在语法语义上的特性,结合现有的
语科库理论和方法,应用句法片段技术和语占学中关于句法截断理论,研究出一套
基于DOP(Data.Oriented
Parsing)的问句句法分析算法,实验表明,与其它句法分
析技术相比,准确率有较大提高。
4)根据中文问句的结构特征,结合文本分类技术中较为成熟的Bayes计算模
型等,对问句的归类进行处理,建立一个准确率较高的中文问句分类算法模型。
5)在中文句法标注语料库的基础上,对中文问句句型进行统计分析,研究设
计出一个问句句型自动识别和获取算法。
6)对中文问答系统中的问句形式化处理、形式化扩展、信息搜索、检索结果
的分析与筛选等进行具体的分析,并研究相关的实现算法。
●
7)对问与答之间的关系作了初步的探讨,提出了陈述句派生疑问句的假设,
并研究了各种不同的派生情况,讨论了基于ontology的复杂问题分解,初步分析了
简单中文句式之间转换的技术方法和关键因素。
关键词: 问答系统问句处理句法分析 句法片断 句法截断 问题分类
信息检索搜索引擎句型分析句型转换Bayes模型本体
博f沧定 向向开艟域|n中芷蝴符系镜¨q处柙杆It技忙研究
ABSTRACT
Question thebranchofinformation
answeringsystem(QA)is retrieval(IR),
●
tOaccurate isthefocusof information
belongs retrieval,and foreign research,
technology
howeveritisstillat at is featureofinformation
startingstagehoming.IR
原创力文档


文档评论(0)