基于支持向量机的问句分析.doc

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于支持向量机的问句分析

基于支持向量机的问句分析 第 2 " 007 期 年8月 计算机技术与发展 COMPUTERTECHNO【DGYANDDEVELOPM旺NT Vo1.17No.8 Aug.2007 基于支持向量机的问旬分析 刘颖,韩杰,滕至阳 (东南大学计算机科学与工程学院,江苏南京210096) 摘要:为提高问答系统对问句理解的准确率,以概念层次网络理论结合传统计算语言学为思路,提出了适用于限定领域 中问句分析模型,根据限定领域的知识特点,设计了新的问句分类方法.在此问句分类方法的基础上,构建了基于支持向 量机理论的问句分类器.在以实际教学过程中所收集的真实问句为问题集和训练集的测试中,取得了较好的实践效果. 关键词:概念层次网络理论;问句分类;支持向量机;中文信息处理;问答系统 中图分类号:TP391.1文献标识码:A文章编号:1673—629X(2007)08—0001—04 ResearchofQuestionAnalysisBasedonSupportVectorMachine LIUYing,HANJie,TENGZhi—yang (Sch~lofComputerSci.andEng.,SoutheastUniversity,Nanjing210096,CbAna) Abstract:Anovelclosed—domainorientedquestionanalysismodulebasedonhierarchicalnetworkofconceptsandtraditionalcomputa. tionallinguisticsispmpo~to~lancetherateofaccuracyofquestioninterpretationofflquestionansweringsystem.Anewquesti~cat. alogisdevelopedonthebasisofcharacteristicsofclosed—domain.Anovelquestionclassifierbasedonsupportvectormachineiscon. structedonthegroundsofthisnewtcatalog.Theresultofexperimentstestedonquestionsgatheredduringprocessofinstructionshows betterpromisetothismethod. Keywords:hierarchicalnetworkofconceptstheory;questioncatalog;supportvectormachine;Chineseinformationprocessing;question answeringsystem 0引言 问答系统(QuestionAnsweringSystem),又称人机 对话系统(HumanMachineConversation,HMC),是指 系统接受用户以自然语言形式描述的提问,从大量半 结构化或者非结构化的数据中,获取能回答此自然语 言形式问句的准确,简洁,个性化的答案.这种答案通 常是一小段正面回答用户提问的文本,而不是像目前 大多数基于关键字串匹配技术的信息检索系统那样返 回数以千计的文档链接. 在远程教育中,为了提高网络教学质量,限定专业 领域内的智能答疑系统成为研究热点.要实现限定领 域内的问答系统,本质上要解决对用户问题的理解和 对领域知识文本的理解,从而使系统根据用户具体问 题从知识文本中提取相应信息转化为用户需要. 笔者以概念层次网络(HierarchicalNetworkof 收稿日期:2006—10—09 基金项目:国家"十五"重大科技攻关项目(2509000012) 作者简介:刘颖(1975一),男,江苏淮阴人,硕士,研究方向为嵌入 式系统,自然语言理解等;滕至阳,教授,研究方向为人工智能,ICAI 等. Concepts,HNC)理论为指导构建了面向限定领域的问 答系统OSAnsExtr,提出在特定领域中的问句分析模 型,注重对限定专业领域内中文问句在语义概念层次 上进行分析,抽取出问句中的领域知识和语义信息,提 高问答系统的性能. 1系统介绍 答疑解惑是教学过程中不可缺少的环节.文中以 《现代操作系统教程》uJ课程答疑为背景,结合HNC理 论构建系统总体模型,如图1所示,其特点是能够抽取 问句文本中的领域知识和语义信息并据此回答用户提 问.系统定位于限定专业领域,一定程度上减少了系 统的复杂性. 系统主体部分采用目前比较流行的问答系统模 型,即由问句分析,文档检索,句段检索,答案抽取四个 模块组成.当用户通过系统接口提交自然语言形式的 问句文本时,系统首先调用由领域知识库和HNC知识 库支持

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档