基于不平衡数据的中文情感分类.pdfVIP

  • 12
  • 0
  • 约1.95万字
  • 约 6页
  • 2017-09-12 发布于北京
  • 举报
第 26卷 第 3期 中文信息学报 V01.26,No.3 2012年 5月 JOURNALOFCHINESEINFORMATION PROCESSING M ay,2012 文章编号 :1003-0077(2012)03-0033—05 基于不平衡数据的中文情感分类 王 中卿 ,李寿山,朱巧 明,李培峰,周 国栋 (苏州大学 计算机科学与技术学院,江苏 苏州 215006) 摘 要 :近些年来 ,情感分类在 自然语言处理研究领域获得 了显著的发展 。然而 ,大部分 已有 的研究都假设参与分 类的正类样本和负类样本一样多,而实际情况中正负类数据的分布往往是不平衡 的。该文收集 四个产品领域的中 文评论文本 ,发现正类样本的数 目远远 多于负类样本 。针对不平衡数据 的中文情感分类 ,提 出了一种基于欠采样 和多分类算法的集成学习框架。在 四个不 同领域的实验结果表 明,我们 的方法能够显著提高分类性能,并明显优

文档评论(0)

1亿VIP精品文档

相关文档