基于贝叶斯方法的中文垃圾邮件过滤技术综述研究.pdfVIP

  • 3
  • 0
  • 约9.24千字
  • 约 7页
  • 2017-12-29 发布于广东
  • 举报

基于贝叶斯方法的中文垃圾邮件过滤技术综述研究.pdf

基于贝叶斯方法的中文垃圾邮件过滤技术综述 张志斌‘,施水才,吕学强 北京信息科技大学中文信息处理研究中心北京100101 Emaih zhmagzhibin@trs.corn.cn 摘要:本文首先介绍了朴素贝叶斯方法的基本原理 分折了决定基于贝叶斯的中文垃圾邮件过滤器的性能 的几个因素,然后比较了几种基于该方法的过滤器 最后总结了制约中文垃圾邮件过滤技术发展的两个重 要因素. 关键字:贝叶斯方法邮件过滤 of ofChinese BaseOn Filtering TechnologySpam Survey Method Bayesian ZHANGZhibin,SHIShuicai,LUXueqiang Information andResearch Information Chinese Science&Technology Processing Center,Beijing 10010l University.Beijing thefactors firstintroducesthebasic ofNaive Method,discusses Abstract:This theory BayesianClassify paper are to resultoftheChincse baseOil some of which the implements import sparefiltering Bayesian,thencompases the ofthe this ofChinese outthreemainfactorsthatlimitsdevelopment technology spamfiltering,andpointod ofChinese end technology sparefiltering砒theofpaper. Keywords:BayesianMethod,SpamFiltering O.引言 邮件是互联网上应用最广的工具之一。但是,如今的互联网,垃圾邮件的活动越来越猖 獗,大大影响了人们的正常网络活动。传统的邮件过滤方法有实时黑名单、白名单、基于规 则的邮件过滤等等。这些方法在一定程度上抑制了垃圾邮件的数量,但是由于缺乏自动更新 和学习的能力,对于变化多端的邮件的过滤越来越力不从心。 邮件过滤可以看作一个二值的分类问题:把邮件分为垃圾邮件和合法邮件.所以很多文 本分类技术针对邮件独有的结构特征经过相应修改,应用到邮件分类中.取得了不错的成绩, Set(粗糙集,研究不完整、 比如基于规则的Ripper(一种松弛的规则匹配算法)【1】、Rough 不确定知识和数据的表达、学习、归纳的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档