面向开放域的中问答系统问句处理相关技术研究.pdf

面向开放域的中问答系统问句处理相关技术研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
面向开放域的中问答系统问句处理相关技术研究

博j论文 面向耳楠蛾竹巾更柏蒋系境问fq灶即锕廷}±术研究 中文摘要, ● 问答系统足信息检索分支,属于精确榆索,足田外信息技术的研究热点,但在 国内还处于起步阶段。信息检索是信息社会的重要特征,各种检索引擎对人们帮助 很大,但足如何使计算机更好地理解人的检索需求,如何获得精确检索结果,这些 目前还处于探索阶段,问答系统正是这个方面的毫要研究内容。本文系统地介绍了 问答系统的研究内容及现状,对中文问答系统与问句处理相关的关键技术进行了较 为深入的分析与探讨,实质性工作和创新点如下: 1)研究中文问答系统的理论框架和系统结构,从总体上对问答系统形成一个 较为清晰的认识,对其中的研究蓖点和难点进行具体的分析。 2)建立一个小规模的问句句法标注语料库(目前国内在该方面还足空白,没 有现成的资源呵资利用),在此基础上,研究相应算法,派生出句法截断数据库和 句法片段数据库,其中基于截断的片段和片段组合抽取算法具有很高的独创性和实 用价值。为高效地建立句法标注语料库,设计研发了一个实用的中文句法编辑与分 析辅助系统。 ● 3)在标注语料库的基础上,根据中文问句在语法语义上的特性,结合现有的 语科库理论和方法,应用句法片段技术和语占学中关于句法截断理论,研究出一套 基于DOP(Data.Oriented Parsing)的问句句法分析算法,实验表明,与其它句法分 析技术相比,准确率有较大提高。 4)根据中文问句的结构特征,结合文本分类技术中较为成熟的Bayes计算模 型等,对问句的归类进行处理,建立一个准确率较高的中文问句分类算法模型。 5)在中文句法标注语料库的基础上,对中文问句句型进行统计分析,研究设 计出一个问句句型自动识别和获取算法。 6)对中文问答系统中的问句形式化处理、形式化扩展、信息搜索、检索结果 的分析与筛选等进行具体的分析,并研究相关的实现算法。 ● 7)对问与答之间的关系作了初步的探讨,提出了陈述句派生疑问句的假设, 并研究了各种不同的派生情况,讨论了基于ontology的复杂问题分解,初步分析了 简单中文句式之间转换的技术方法和关键因素。 关键词: 问答系统问句处理句法分析 句法片断 句法截断 问题分类 信息检索搜索引擎句型分析句型转换Bayes模型本体 博f沧定 向向开艟域|n中芷蝴符系镜¨q处柙杆It技忙研究 ABSTRACT Question thebranchofinformation answeringsystem(QA)is retrieval(IR), ● tOaccurate isthefocusof information belongs retrieval,and foreign research, technology howeveritisstillat at is featureofinformation startingstagehoming.IR

文档评论(0)

chuotuo0075779 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档