利用上下位关系的中文短文本分类.pdfVIP

  • 3
  • 0
  • 约2.42万字
  • 约 5页
  • 2018-04-07 发布于北京
  • 举报
第30卷第3期 计算机应用 V01.30No.3 of Mar.2010 2010年3月 Journal ComputerApplications 文章编号:1001—9081(2010)03—0603—04 利用上下位关系的中文短文本分类 王盛,樊兴华,陈现麟 (重庆邮电大学计算机科学与技术研究所。重庆400065) (ws371 1718@yahoo.tom.en) 摘要:针对短文本长度短、描述信号弱的特点,提出了一种利用上下位关系的中文短文本分类框架。该框架首 先利用“知网”确定训练文本中概念对的上下位关系,进而确定词语对的上下位关系,再将其用于扩展测试文本的特 征向量,从而实现对测试文本的分类。实验表明:利用上下位关系能够改善短文本的分类性能。 关键词:短文本;知网;上下位关系;特征扩展 文献标志码:A 中图分类号:TP391.1;TPl8 Chineseshorttextclassificationbasedon relation hyponymy WANG Xian—lin Sheng,FANXing—hua,CHEN of Scienceand and (InstituteComputer Technology,ChongqingU,uversuy旷PoasTelecommunications,Chongqing400065,China) theshort andweak todescribe of frameworkof Abstract:Concerninglength signal thecharacteristicsshorttext,a Chineseshort·textclassificationWag forward ordertoachievetheclassificationofthetest put byusinghyponymy.In text,the frameworkfirstused”Hownet”todeterminethe between in the hyponymy pairstrainingtext,thusdetermining concept betweenword thenthefeaturevectorsoftesttextwereextended.The resultsshowthat hyponymy pairs,and experimental short-textclassification callbe the performanceimprovedbyusinghyponymy. extension relation;feature Keyw

文档评论(0)

1亿VIP精品文档

相关文档