基于支持向量机的中文文本蕴涵识别研究-计算机应用与软件.PDFVIP

  • 1
  • 0
  • 约2.54万字
  • 约 5页
  • 2019-03-01 发布于天津
  • 举报

基于支持向量机的中文文本蕴涵识别研究-计算机应用与软件.PDF

基于支持向量机的中文文本蕴涵识别研究-计算机应用与软件.PDF

第31卷第4期    计算机应用与软件 Vol31No.4 2014年4月   ComputerApplicationsandSoftware Apr.2014 基于支持向量机的中文文本蕴涵识别研究 1 1 2 李 妍  刘茂福  姬东鸿 1(武汉科技大学计算机科学与技术学院 湖北武汉430065) 2(武汉大学计算机学院 湖北武汉430072) 摘 要  文本蕴涵关系研究的主要目的是在建立通用文本推理框架的同时,解决自然语言语义表达的多样性问题。将中文文本 蕴涵关系识别问题归结为一种分类问题,进而基于支持向量机构造分类模型,对中文文本对间的语义关系进行分类;主要采用统计、 词汇语义以及句法相关的分类特征。实验结果表明基于支持向量机的多分类器可以有效地对中文文本蕴涵关系进行识别。 关键词  文本蕴涵 支持向量机 统计特征 词汇语义特征 句法特征 中图分类号 TP391.1    文献标识码 A    DOI:10.3969/j.issn.1000386x.2014.04.013 ONSVMBASEDCHINESETEXTUALENTAILMENTRECOGNITION 1 1 2 LiYan LiuMaofu JiDonghong 1(CollegeofComputerScienceandTechnology,WuhanUniversityofScienceandTechnology,Wuhan430065,Hubei,China) 2(SchoolofComputer,WuhanUniversity,Wuhan430072,Hubei,China) Abstract  Textualentailmentrelationresearchmainlyaimstobuildacommonframeworkfortextualinferenceandsolvetheproblemof semanticexpressiondiversityinnaturallanguageatthesametime.Inthispaper,wecomedowntherecognitionofChinesetextualentailment relationtoakindofclassificationproblem,andthenconstructtheclassificationmodelbasedonsupportvectormachineforclassifyingthe semanticrelationsbetweenthegivenChinesetextpairs.Itmainlyadoptsthestatistic,lexicalsemanticandsyntacticcorrelatedclassification features.ExperimentalresultsshowthattheSVMbasedmultipleclassifierscaneffectivelyrecognisetheChinesetextualentailmentrelation. Keywords  Textualentailment Supportvectormachine(SVM) Statisticfeature Lexicalsemanticfeature Syntacticfeature 涵H1,但反过来,H1并不蕴涵 T1。根据文本蕴涵的方向性,可 0 引 言 以将蕴涵关系细分为正向蕴涵、逆向蕴涵、双向蕴涵和矛盾四

文档评论(0)

1亿VIP精品文档

相关文档