基于偏最小二乘特征抽取的垃圾邮件过滤.PDF

基于偏最小二乘特征抽取的垃圾邮件过滤.PDF

基于偏最小二乘特征抽取的垃圾邮件过滤.PDF

22 1 Vol. 22, No . 1 2008 1 JOU RNAL OF CHINESE INFORMAT ION PROCESSIN G Jan., 2008 : 1003-00 ( 2008) 01-00 4-06 , , , ( , 330022) : 随着垃圾邮件逐渐成为网络用户的一大困扰, 垃圾邮件过滤技术的研究显得越来越重要 对电子邮件 存在数据极度稀疏性高特征维数和多重相关性等特点, 本文提出了一种基于偏最小二乘原理的特征抽取方法, 可 以通过对原始特征进行线性组合抽取出既可反映邮件内容又可反映邮件类型的潜在语义特征, 并可解决多重相关 性问题在Enron-Spam 邮件数据集上的实验结果表明, 同V 2 特征选择方法相比, 该方法在较低维数上可以获取良 好的邮件过滤性能 : 计算机应用; 中文信息处理; 垃圾邮件过滤; 偏最小二乘;特征抽取 : T P391 : A

文档评论(0)

1亿VIP精品文档

相关文档