- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于 Linux 的中文垃圾邮件过滤系统设计与实现汪 洁 1,朱军 2*(1. 安徽农业
基于 Linux 的中文垃圾邮件过滤系统设计与实现
汪 洁 1,朱
军 2*
(1. 安徽农业大学图书馆,合肥 230036;2. 安徽农业大学信息与计算机学院,合肥 230036)
摘 要:大量的商业、色情和反动垃圾邮件和邮件病毒的泛滥给互联网用户带来很多烦恼和侵害,也给社会带
来了极大的负面影响,邮件系统的安全问题引起业界的重点关注。作者提出了一种基于规则方法和基于统计方法相 结合的中文垃圾邮件过滤方案,通过机器学习解决了邮件训练集和中文过滤规则的自动更新问题,并利用 Linux 下的多种开源软件,设计与实现了一款基于 Linux 的中文垃圾邮件过滤系统。
关键词:中文;垃圾邮件;过滤;Linux;设计与实现
中图分类号:TP 393.098
文献标识码:A
文章编号:1672?352X (2011)02?0309?06
Design and implementation of Chinese-spam filtering system based on Linux
WANG Jie1, ZHU Jun2
(1. Library of Anhui Agricultural University, Hefei 230036;
2. School of Information and Computer, Anhui Agricultural University, Hefei 230036)
Abstract: The flooding of all kinds of spam has become a headache problem for human and society. Mail
system security attracts wide attentions and becomes a research focus in industry. In this paper, we put forward a project of Chinese-spam filtering by combining methods on the basis of the rule and the statistics, and solved the auto update technology in mail training set and Chinese characters filtering rule by machine learning. A kind of Chinese-spam filtering system was designed to realize it function with some kinds of Open Source Software based on Linux.
Key words: Chinese;spam;filtering;Linux;design and implementation
电子邮件系统是互联网的一个成功典范,随着
互联网的进一步发展,电子邮件已成为 Internet 用 户最常用的通信方式之一,其作用也越来越重要。 然而,由于早期在设计邮件系统是建立在完全开放 和信任基础上,这就给广告商和恶意的黑客钻了空 子,近年来大量垃圾邮件的泛滥给互联网用户带来 很多的烦恼和侵害,它不仅增加了用户对邮件的处 理时间,而且被利用来传播计算机病毒和大量色情、 反动的信息,给社会带来了极大的负面影响。垃圾 邮件就像瘟疫一样蔓延,严重污染了我们的网络环 境,而且占用了大量的网络传输、存储和运算资源。
目前市场有许多反垃圾邮件产品,如:亿邮反 垃圾邮件网关、趋势反垃圾邮件网关、美讯智 SMG、 梭子鱼、EQManager 等。这些软件对遏制垃圾邮件
的泛滥起到了一定的作用。但是它们过分依赖黑白
名单和手工制订规则(如关键词过滤),尽管也采用 了贝叶斯过滤技术,但由于垃圾邮件千变万化,特 别是中文邮件和英文邮件在信息处理上有很大差 别,而且这些过滤软件对中文垃圾邮件过滤效果尚 不理想,普遍存在误判和漏判现象。由于商业软件 源代码的隐蔽性,无法对其进行分析改进或二次开 发。
与这些商业软件相比,基于 Linux 的开源垃圾 邮件过滤软件由于其源代码开放,且与各种邮件系 统的接口简单易用,给我们提供了一个低成本定制 适合自身邮件过滤系统的机会。作者采用基于规则 方法和基于统计方法相结合的的思想,在保障邮件 服务器系统安全的前提下,利用 LINUX 下的多种
收稿日期: 2010-12-06
基金项目: 安徽省教育厅自然科学研究项目(KJ2007B248)资助。
作者简介: 汪洁,女,助理工
文档评论(0)