邮件过滤中一种改进特征选择方法研究-邮件过滤中一种.PDFVIP

  • 5
  • 0
  • 约1.47万字
  • 约 4页
  • 2017-06-16 发布于湖北
  • 举报

邮件过滤中一种改进特征选择方法研究-邮件过滤中一种.PDF

第 l9卷 第 l期 计 算机 技 术 与 发展 Vo1.19 No.1 2009年 L月 CO~1lIJTERTE(HNOIX;Y AN-DDEVEIOPMENT Jan. 20(}9 邮件过滤中一种改进的特征选择方法研究 林 伟 ,柳荣其 ,徐 熙 (西华大学数学与计算机学院,四川成都 610039) 摘 要:特征选择是基于内容的垃圾邮件过滤的重要过程 ,它有效地改善过滤效率和精度。文中分析了 IG和CHI应用到 垃圾邮件过滤中存在的不足,设计了一种改进的评价函数。而由于这种评价函数的特征选择方法只度量了特征与类的关 系,忽略了特征之间依赖的关系,因此进一步用基于互信息的聚类方法来消除特征间冗余。实验结果表明该特征选择方 法有效地提高了邮件过滤的性能。 关键词:邮件过滤;特征选择;信息增益;CHI统计;聚类 中图分类号:TP18 文献标识码:A 文章编号:1673—629x(20o9)01—0084

文档评论(0)

1亿VIP精品文档

相关文档