- 3
- 0
- 约2.42万字
- 约 5页
- 2018-04-07 发布于北京
- 举报
第30卷第3期 计算机应用 V01.30No.3
of Mar.2010
2010年3月 Journal
ComputerApplications
文章编号:1001—9081(2010)03—0603—04
利用上下位关系的中文短文本分类
王盛,樊兴华,陈现麟
(重庆邮电大学计算机科学与技术研究所。重庆400065)
(ws371
1718@yahoo.tom.en)
摘要:针对短文本长度短、描述信号弱的特点,提出了一种利用上下位关系的中文短文本分类框架。该框架首
先利用“知网”确定训练文本中概念对的上下位关系,进而确定词语对的上下位关系,再将其用于扩展测试文本的特
征向量,从而实现对测试文本的分类。实验表明:利用上下位关系能够改善短文本的分类性能。
关键词:短文本;知网;上下位关系;特征扩展
文献标志码:A
中图分类号:TP391.1;TPl8
Chineseshorttextclassificationbasedon relation
hyponymy
WANG Xian—lin
Sheng,FANXing—hua,CHEN
of Scienceand and
(InstituteComputer Technology,ChongqingU,uversuy旷PoasTelecommunications,Chongqing400065,China)
theshort andweak todescribe of frameworkof
Abstract:Concerninglength signal thecharacteristicsshorttext,a
Chineseshort·textclassificationWag forward ordertoachievetheclassificationofthetest
put byusinghyponymy.In text,the
frameworkfirstused”Hownet”todeterminethe between in the
hyponymy pairstrainingtext,thusdetermining
concept
betweenword thenthefeaturevectorsoftesttextwereextended.The resultsshowthat
hyponymy pairs,and experimental
short-textclassification callbe the
performanceimprovedbyusinghyponymy.
extension
relation;feature
Keyw
原创力文档

文档评论(0)