- 7
- 0
- 约2.27万字
- 约 10页
- 2016-01-23 发布于安徽
- 举报
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
北京大学学报(自然科学版) 第 51卷 第 2期 2015年 3月
ActaScientiarum Naturalium UniversitatisPekinensis,Vo1.51,No.2(Mar.2O15)
doi:10.13209~.0479—8023.2015.050
基于类别层次结构的多层文本分类样本扩展策略
李保利
河南工业大学计算机科学系,郑州 450001;E—mail:csblli@gmail.com
摘要 针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题,提出并 比较几种基于类别层
次结构的大规模多层文本分类样本扩展策略,即利用类别层次体系中蕴含的类别名称 、描述以及类别间的层
次结构关系,从 内涵和外延两方面入手构造或扩展类别训练样本 。在首次大规模 中文新 闻信息多层分类评测
数据集上,基于外延的局部样本扩展策略取得较好 的性能。参测系统在第一级类别和第二级类别上宏平均
F1分别为 0.8413和 0.7l39,在 10个参赛系统 中位列第二 。
关键词 多层文本分类;大规模中文新闻分类;中文新闻信息分类;类别层次体系
中图
您可能关注的文档
最近下载
- ISO31000风险管理标准中文版.doc VIP
- 纪检监察干部业务培训工作方案.docx VIP
- Origin能量体积曲线拟合.pdf VIP
- 危险化学品目录(2015版)201551.doc
- 岗位质量责任承诺书(6篇).docx VIP
- GB_T 3183-2025 完整实施指南:砌筑水泥标准解读(含与GB_T 176-2025衔接).docx VIP
- 《公路水路典型运输和设施零碳试点工作方案》.docx
- 国开(SX)-工程伦理-形考任务三(权重20%)-学习资料.docx
- 计量基础知识题库(附答案).docx VIP
- 广东宝莫生物化工有限公司7.5万吨_年生物法丙烯酰胺扩产及增加丙烯腈经营储存许可资质技改项目环境影响报告书.docx VIP
原创力文档

文档评论(0)