《基于统计的垃圾邮件过滤器的设计与实现》-毕业论文.docVIP

  • 81
  • 0
  • 约2.47万字
  • 约 35页
  • 2018-11-16 发布于广西
  • 举报

《基于统计的垃圾邮件过滤器的设计与实现》-毕业论文.doc

摘 要 随着Internet的发展, 电子邮件已成为用户最便捷和经济的交流方式之一,由于发送电子邮件非常容易、 成本又非常之低, 使得电子邮件成为一种电子化的手段被人利用,垃圾邮件制造者出于商业性或其它各种目的而大量向用户发送电子邮件。我们呼吁有关人士必须逐渐从立法、行政和规范角度出发采取全面有效的措施,但目前主要依靠的还是反垃圾邮件技术。典型的邮件过滤技术有黑白名单、规则过滤、概率统计分类等。为了降低误判,更好的适应多变和形式多样的垃圾邮件,本文采用基于统计(Bayes算法)的反垃圾邮件技术。利用已知的邮件,建立垃圾邮件和非垃圾邮件关键词的贝叶斯概率模型,然后利用该模型判断邮件是否为垃圾邮件。为了提高过滤模块性能,本系统采用支持首字Hash的分词算法。对于词首字的查找,根据汉字机内码编码规律,GB2312编码表中的每一个汉字在首字Hash表中都有唯一的一项与其对应。 关键词:Bayes算法;邮件过滤;反垃圾邮件 ABSTRACT With the development of Internet, e-mail has become the user the most convenient and economical means of communication is one of very easy as sending e-mail, the cost and v

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档