- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第32卷/第1期/ 河北师范大学学报/自然科学版/ VOI.32 No.1
2008年 1月 JOURNAL OF HEBEI NORMAL UNIVERSITY/Natural Science Edition/ Jan.2008
反垃圾邮件新技术
羊 裔 高 ,
(1.成都信息工程学院院长办公室,四川成都 610225;2.成都理 【大学信息工程学院,四川成都 610059)
摘 要:垃圾邮件的泛滥已经严重影响到了人们的生活、工作、学习等方面,因此,反垃圾邮件技术也不断推
出.介绍了几种目前较新的反垃圾邮件技术.
关键词:垃圾邮件;反垃圾邮件技术;病毒
中图分类号:TP 393 文献标识码:A 文章编号:1000—5854(2008)01—0030—03
1 垃圾邮件
电子邮件是Internet主要应用之一,在信息技术应用极其广泛的今天,电子邮件占了越来越重要的地
位,在商业、管理、办公等方面都有不可替代的作用.然而,垃圾邮件的产生,影响了正常电子邮件的通信,占
用了传输带宽,大量宝贵的网络带宽被无效、甚至有害的垃圾邮件所阻塞,用户邮箱被大量垃圾邮件充斥着.
2003年终统计显示:中国邮件服务器总计接收到的垃圾邮件为1 500亿封,用户实际共计收到垃圾邮件470
亿封,经济损失48亿.《第十四次中国互联网络发展状况统计报告》显示,我国网民在2004年7月份每周收
到13.8封电子邮件,其中正常电子邮件为4.6封,垃圾邮件数却达到9.2封….电子邮件服务企业,为治理
垃圾邮件投入了大量的人力、物力、财力和技术,增加了网络企业运营的成本.同时,垃圾邮件的泛滥,也进一
步加剧了病毒的传播,如蠕虫、特洛伊木马等病毒.
邮件传输协议SMTP协议本身是一个简化的邮件递交协议,缺乏很多必要的身份认证,这是SMTP协
议造成垃圾邮件泛滥的原因之一.由于SMTP协议中,允许发信人伪造绝大多数的发信人特征信息,如发信
人、信件路由等,甚至在通过匿名转发、开放转发和开放代理等手段后,可以近乎完全地抹去垃圾邮件的发信
人特征【2J.目前,绝大多数的垃圾邮件都伪造了其真实的发信来源,这对于发现制止垃圾邮件的传播造成了
很大的困难.SMTP协议还缺少一些必要的行为控制,不能有效地甄别正常的邮件发送和垃圾邮件发送行
为,这也是造成垃圾邮件泛滥的原因.宽带网络的快速发展,网络通信成本的下降,成本与产出的巨大反差,
缺乏法律与规范的约束等一系列原因,使得垃圾邮件泛滥.
近年来,我国为治理垃圾邮件做出了很多努力:2002年11月成立了民间的反垃圾邮件协调小组,推出
了《中国互联网协会反垃圾邮件工作规范》;2004年1月,国家四部委联合发文要求整治垃圾邮件和不良信
息;2006年3月,信息产业部出台了《电子邮件服务管理办法》等n].从民间的行业自律到政府的行政法规的
出台,都表明了社会各界已经意识到垃圾邮件的危害.
传统反垃圾邮件技术主要包括关闭开放转发和开启发件认证、关闭匿名代理、静态黑名单与静态白名
单、静态内容过滤、实时黑名单、数量控制等.本文中,笔者介绍了几个较新的反垃圾邮件新技术.
2 反垃圾邮件新型技术
2.1 贝叶斯分析
贝叶斯分析技术的核心是贝叶斯定理.
1)收集大量的垃圾邮件和非垃圾邮件,建立垃圾邮件集和非垃圾邮件集.
2)提取邮件主题和邮件体中的独立字符串,如“办”、“法”等作为TOKEN串,并统计其出现的频率.按
照这个方法分布处理垃圾邮件集和非垃圾邮件集的所有邮件.
3)为每个邮件集对应1个哈希表,hashtable—good对应非垃圾邮件集,hashtable—bad对应垃圾邮件集,表
收稿日期:2007—1O—O8
作者简介:羊裔高(1972一),男,四川绵阳人,讲师,成都理工大学博士研究生,研究方向为计算机网络
· 31 ·
中存储TOKEN串到字频的映射关系.
4)计算每个哈希表中TOKEN串出现的概率,即P为某TOKEN串的字频/对应哈希表的长度.
5)计算该邮件为垃圾邮件的概率.
设
文档评论(0)