- 6
- 0
- 约4.24千字
- 约 16页
- 2017-03-04 发布于湖北
- 举报
基于模糊软集合理论的文本分类方法 摘 要:为提高文本分类精度,提出一种基于模糊软集合理论的文本分类方法。该方法把文本训练集表示成模糊软集合表格形式,通过约简、构造软集合对照表方法找出待分类文本所属类别,并针对文本特征提取过程中由于相近特征而导致分类精度下降问题给出一种基于正则化互信息特征选择算法,有效地解决了上述问题。与传统的 KNN 和 SVM 分类算法相比,模糊软集合方法在文本分类的精度和准度上都有所提高。 关键词:文本分类;软集合;模糊软集合;特征选择;互信息 1 概述 软集合理论是学者于 1999 年提出的一种新的处理不确定、模糊及未被清楚定义的对象的数学工具。目前被广泛应用处理不确定性问题的数学理论和工具有:概率论,模糊集理论,区间数学,粗糙集等,但是所有这些理论和结果都有其不完善的方面,产生这些问题的主要原因在于参数化工具的不足。而软集合理论就是处理不确定性且不存在上述问题的强有力数学工具。当前,有越来越多的学者投入到软集理论及应用的研究,有文献对软集的基本理论进行了研究,并给出软集在决策中的一些应用;Cheng 和 Tsang 给出了基于软集理论的属性约简方法并和粗糙集中的属性约简作了相应的比较;有文献在考虑增加属性及次优选择问题上给出了正则化属性约简原理并给出相应的约简算法;Zhou 和 Xiao给出使用软集来分析不完备信息系统的方法。 文本
原创力文档

文档评论(0)