基于正文和标题文本分类的主题建模-计算机应用与软件.PDFVIP

  • 58
  • 0
  • 约1.93万字
  • 约 5页
  • 2018-06-06 发布于天津
  • 举报

基于正文和标题文本分类的主题建模-计算机应用与软件.PDF

基于正文和标题文本分类的主题建模-计算机应用与软件

第34卷第9期    计算机应用与软件 Vol34No.9 2017年9月   ComputerApplicationsandSoftware Sep.2017 基于正文和标题文本分类的主题建模 郑 诚 于秀开 徐启南 (安徽大学计算智能与信号处理重点实验室 安徽合肥230039) (安徽大学计算机科学与技术学院 安徽合肥230601) 摘 要  特征稀疏是对传统文本分类的一个巨大的挑战。基于LDA模型,提出一种特征扩展的短文本分类模 型。该模型在正文语料的基础上加入标题语料的主题分布,并进行整合,得到每个文本的主题分布。使用SVM 分类器进行分类。实验结果表明,与正文语料进行文本分类相比,所提模型对文本分类效果较好。 关键词  文本分类 LDA 特征扩展 主题分布 SVM 中图分类号 TP391.1    文献标识码 A    DOI:10.3969/j.issn.1000386x.2017.09.016 TOPICMODEL

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档