文本分类综述1.pdf

文本分类综述

1.引言

1.1文本分类的定义

文本分类用电脑行文本集依据肯定的分类体系或标准进行自动分类标记,与

文本分类相近的概念是文本聚类。文本聚类是,由机器将相像的文档归在一起。

与文本分类的区分在于,文本分类是监督学习,类别是事先规定好的,文本聚类

是无监督学习,由计算机把类似文本归在一起,事先并不划定好类别。

基于统计的文本分类算法进行文本分类就是由计算机自己来观看由人供应

的训练文档集,自己总结出用于判别文档类

文档评论(0)

1亿VIP精品文档

相关文档