- 58
- 0
- 约1.93万字
- 约 5页
- 2018-06-06 发布于天津
- 举报
基于正文和标题文本分类的主题建模-计算机应用与软件
第34卷第9期 计算机应用与软件 Vol34No.9
2017年9月 ComputerApplicationsandSoftware Sep.2017
基于正文和标题文本分类的主题建模
郑 诚 于秀开 徐启南
(安徽大学计算智能与信号处理重点实验室 安徽合肥230039)
(安徽大学计算机科学与技术学院 安徽合肥230601)
摘 要 特征稀疏是对传统文本分类的一个巨大的挑战。基于LDA模型,提出一种特征扩展的短文本分类模
型。该模型在正文语料的基础上加入标题语料的主题分布,并进行整合,得到每个文本的主题分布。使用SVM
分类器进行分类。实验结果表明,与正文语料进行文本分类相比,所提模型对文本分类效果较好。
关键词 文本分类 LDA 特征扩展 主题分布 SVM
中图分类号 TP391.1 文献标识码 A DOI:10.3969/j.issn.1000386x.2017.09.016
TOPICMODEL
您可能关注的文档
- 地质数据更新与应用服务-中国地质调查局.PDF
- 地连墙质量控制新措施-中国港湾建设.PDF
- 地震与声测井资料的匹配-石油地球物理勘探.PDF
- 地质网格技术在复杂断块油藏地质建模中的应用-石油地球物理勘探.PDF
- 地震前兆监测—重力重复观测与地磁连续资料分析II-中央气象局.PDF
- 地震勘探野外生产实习基地.PDF
- 地震地热说原理与应用-科学网—博客.PDF
- 地震盈前深度偏移方法流程及应用.PDF
- 地震海6数值模拟中海洋水深数据的敏感性研究-自然灾害学报.PDF
- 地面用太阳电池标定的一般规定.PDF
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 宣贯培训(2026年)《GBT 6391-2010 滚动轴承 额定动载荷和额定寿命》标准深度宣贯与技术前瞻培训.pptx VIP
- GBT 6391-2010 滚动轴承 额定动载荷和额定寿命.docx VIP
- 8-2-5-5水泵联合排水试验报告(定稿)[1].doc VIP
- 石城县志(卷之1-9)蒋廷桂 主修,光绪18[1892]-5.pdf VIP
- 卡通角色IP开发合作协议.docx
- 煤矿井下排水系统联合排水试验规范.docx VIP
- 卡通IP授权开发合同协议.docx
- AP宏观经济学(2016年真题)全套含选择题.pdf VIP
- 光的干涉衍射和偏振(教师版).docx VIP
- 聊天记录怎样彻底删除?防止手机聊天记录恢复攻略.docx VIP
原创力文档

文档评论(0)