基于类别层次结构的多层文本分类样本扩展策略.pdfVIP

  • 7
  • 0
  • 约2.27万字
  • 约 10页
  • 2016-01-23 发布于安徽
  • 举报

基于类别层次结构的多层文本分类样本扩展策略.pdf

--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!

北京大学学报(自然科学版) 第 51卷 第 2期 2015年 3月 ActaScientiarum Naturalium UniversitatisPekinensis,Vo1.51,No.2(Mar.2O15) doi:10.13209~.0479—8023.2015.050 基于类别层次结构的多层文本分类样本扩展策略 李保利 河南工业大学计算机科学系,郑州 450001;E—mail:csblli@gmail.com 摘要 针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并 比较几种基于类别层 次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称 、描述以及类别间的层 次结构关系,从 内涵和外延两方面入手构造或扩展类别训练样本 。在首次大规模 中文新 闻信息多层分类评测 数据集上,基于外延的局部样本扩展策略取得较好 的性能。参测系统在第一级类别和第二级类别上宏平均 F1分别为 0.8413和 0.7l39,在 10个参赛系统 中位列第二 。 关键词 多层文本分类;大规模中文新闻分类;中文新闻信息分类;类别层次体系 中图

文档评论(0)

1亿VIP精品文档

相关文档