基于支持向量机的中文文本蕴涵识别研究-计算机应用与软件.PDFVIP

下载本文档

1
0
约2.54万字
约 5页
2019-03-01 发布于天津
举报

基于支持向量机的中文文本蕴涵识别研究-计算机应用与软件.PDF

第３１卷第４期　　　计算机应用与软件Ｖｏｌ３１Ｎｏ．４２０１４年４月　　ＣｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓａｎｄＳｏｆｔｗａｒｅＡｐｒ．２０１４基于支持向量机的中文文本蕴涵识别研究１１２李　妍　刘茂福　姬东鸿１（武汉科技大学计算机科学与技术学院　湖北武汉４３００６５）２（武汉大学计算机学院　湖北武汉４３００７２）摘　要　　文本蕴涵关系研究的主要目的是在建立通用文本推理框架的同时，解决自然语言语义表达的多样性问题。将中文文本蕴涵关系识别问题归结为一种分类问题，进而基于支持向量机构造分类模型，对中文文本对间的语义关系进行分类；主要采用统计、词汇语义以及句法相关的分类特征。实验结果表明基于支持向量机的多分类器可以有效地对中文文本蕴涵关系进行识别。关键词　　文本蕴涵　支持向量机　统计特征　词汇语义特征　句法特征中图分类号　ＴＰ３９１．１　　　　文献标识码　Ａ　　　　ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１０００３８６ｘ．２０１４．０４．０１３ＯＮＳＶＭＢＡＳＥＤＣＨＩＮＥＳＥＴＥＸＴＵＡＬＥＮＴＡＩＬＭＥＮＴＲＥＣＯＧＮＩＴＩＯＮ１１２ＬｉＹａｎ　ＬｉｕＭａｏｆｕ　ＪｉＤｏｎｇｈｏｎｇ１（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＷｕｈａｎＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｗｕｈａｎ４３００６５，Ｈｕｂｅｉ，Ｃｈｉｎａ）２（ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒ，ＷｕｈａｎＵｎｉｖｅｒｓｉｔｙ，Ｗｕｈａｎ４３００７２，Ｈｕｂｅｉ，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ　　Ｔｅｘｔｕａｌｅｎｔａｉｌｍｅｎｔｒｅｌａｔｉｏｎｒｅｓｅａｒｃｈｍａｉｎｌｙａｉｍｓｔｏｂｕｉｌｄａｃｏｍｍｏｎｆｒａｍｅｗｏｒｋｆｏｒｔｅｘｔｕａｌｉｎｆｅｒｅｎｃｅａｎｄｓｏｌｖｅｔｈｅｐｒｏｂｌｅｍｏｆｓｅｍａｎｔｉｃｅｘｐｒｅｓｓｉｏｎｄｉｖｅｒｓｉｔｙｉｎｎａｔｕｒａｌｌａｎｇｕａｇｅａｔｔｈｅｓａｍｅｔｉｍｅ．Ｉｎｔｈｉｓｐａｐｅｒ，ｗｅｃｏｍｅｄｏｗｎｔｈｅｒｅｃｏｇｎｉｔｉｏｎｏｆＣｈｉｎｅｓｅｔｅｘｔｕａｌｅｎｔａｉｌｍｅｎｔｒｅｌａｔｉｏｎｔｏａｋｉｎｄｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎｐｒｏｂｌｅｍ，ａｎｄｔｈｅｎｃｏｎｓｔｒｕｃｔｔｈｅｃｌａｓｓｉｆｉｃａｔｉｏｎｍｏｄｅｌｂａｓｅｄｏｎｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｆｏｒｃｌａｓｓｉｆｙｉｎｇｔｈｅｓｅｍａｎｔｉｃｒｅｌａｔｉｏｎｓｂｅｔｗｅｅｎｔｈｅｇｉｖｅｎＣｈｉｎｅｓｅｔｅｘｔｐａｉｒｓ．Ｉｔｍａｉｎｌｙａｄｏｐｔｓｔｈｅｓｔａｔｉｓｔｉｃ，ｌｅｘｉｃａｌｓｅｍａｎｔｉｃａｎｄｓｙｎｔａｃｔｉｃｃｏｒｒｅｌａｔｅｄｃｌａｓｓｉｆｉｃａｔｉｏｎｆｅａｔｕｒｅｓ．ＥｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅＳＶＭｂａｓｅｄｍｕｌｔｉｐｌｅｃｌａｓｓｉｆｉｅｒｓｃａｎｅｆｆｅｃｔｉｖｅｌｙｒｅｃｏｇｎｉｓｅｔｈｅＣｈｉｎｅｓｅｔｅｘｔｕａｌｅｎｔａｉｌｍｅｎｔｒｅｌａｔｉｏｎ．Ｋｅｙｗｏｒｄｓ　　Ｔｅｘｔｕａｌｅｎｔａｉｌｍｅｎｔ　Ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ（ＳＶＭ）　Ｓｔａｔｉｓｔｉｃｆｅａｔｕｒｅ　Ｌｅｘｉｃａｌｓｅｍａｎｔｉｃｆｅａｔｕｒｅ　Ｓｙｎｔａｃｔｉｃｆｅａｔｕｒｅ涵Ｈ１，但反过来，Ｈ１并不蕴涵Ｔ１。根据文本蕴涵的方向性，可０　引　言以将蕴涵关系细分为正向蕴涵、逆向蕴涵、双向蕴涵和矛盾四

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于支持向量机的中文文本蕴涵识别研究-计算机应用与软件.PDFVIP