- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于支持向量机的问句分析
基于支持向量机的问句分析
第
2
"
007
期
年8月
计算机技术与发展
COMPUTERTECHNO【DGYANDDEVELOPM旺NT
Vo1.17No.8
Aug.2007
基于支持向量机的问旬分析
刘颖,韩杰,滕至阳
(东南大学计算机科学与工程学院,江苏南京210096)
摘要:为提高问答系统对问句理解的准确率,以概念层次网络理论结合传统计算语言学为思路,提出了适用于限定领域
中问句分析模型,根据限定领域的知识特点,设计了新的问句分类方法.在此问句分类方法的基础上,构建了基于支持向
量机理论的问句分类器.在以实际教学过程中所收集的真实问句为问题集和训练集的测试中,取得了较好的实践效果.
关键词:概念层次网络理论;问句分类;支持向量机;中文信息处理;问答系统
中图分类号:TP391.1文献标识码:A文章编号:1673—629X(2007)08—0001—04
ResearchofQuestionAnalysisBasedonSupportVectorMachine
LIUYing,HANJie,TENGZhi—yang
(Sch~lofComputerSci.andEng.,SoutheastUniversity,Nanjing210096,CbAna)
Abstract:Anovelclosed—domainorientedquestionanalysismodulebasedonhierarchicalnetworkofconceptsandtraditionalcomputa.
tionallinguisticsispmpo~to~lancetherateofaccuracyofquestioninterpretationofflquestionansweringsystem.Anewquesti~cat.
alogisdevelopedonthebasisofcharacteristicsofclosed—domain.Anovelquestionclassifierbasedonsupportvectormachineiscon.
structedonthegroundsofthisnewtcatalog.Theresultofexperimentstestedonquestionsgatheredduringprocessofinstructionshows
betterpromisetothismethod.
Keywords:hierarchicalnetworkofconceptstheory;questioncatalog;supportvectormachine;Chineseinformationprocessing;question
answeringsystem
0引言
问答系统(QuestionAnsweringSystem),又称人机
对话系统(HumanMachineConversation,HMC),是指
系统接受用户以自然语言形式描述的提问,从大量半
结构化或者非结构化的数据中,获取能回答此自然语
言形式问句的准确,简洁,个性化的答案.这种答案通
常是一小段正面回答用户提问的文本,而不是像目前
大多数基于关键字串匹配技术的信息检索系统那样返
回数以千计的文档链接.
在远程教育中,为了提高网络教学质量,限定专业
领域内的智能答疑系统成为研究热点.要实现限定领
域内的问答系统,本质上要解决对用户问题的理解和
对领域知识文本的理解,从而使系统根据用户具体问
题从知识文本中提取相应信息转化为用户需要.
笔者以概念层次网络(HierarchicalNetworkof
收稿日期:2006—10—09
基金项目:国家"十五"重大科技攻关项目(2509000012)
作者简介:刘颖(1975一),男,江苏淮阴人,硕士,研究方向为嵌入
式系统,自然语言理解等;滕至阳,教授,研究方向为人工智能,ICAI
等.
Concepts,HNC)理论为指导构建了面向限定领域的问
答系统OSAnsExtr,提出在特定领域中的问句分析模
型,注重对限定专业领域内中文问句在语义概念层次
上进行分析,抽取出问句中的领域知识和语义信息,提
高问答系统的性能.
1系统介绍
答疑解惑是教学过程中不可缺少的环节.文中以
《现代操作系统教程》uJ课程答疑为背景,结合HNC理
论构建系统总体模型,如图1所示,其特点是能够抽取
问句文本中的领域知识和语义信息并据此回答用户提
问.系统定位于限定专业领域,一定程度上减少了系
统的复杂性.
系统主体部分采用目前比较流行的问答系统模
型,即由问句分析,文档检索,句段检索,答案抽取四个
模块组成.当用户通过系统接口提交自然语言形式的
问句文本时,系统首先调用由领域知识库和HNC知识
库支持
文档评论(0)