反垃圾邮件新技术.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第32卷/第1期/ 河北师范大学学报/自然科学版/ VOI.32 No.1 2008年 1月 JOURNAL OF HEBEI NORMAL UNIVERSITY/Natural Science Edition/ Jan.2008 反垃圾邮件新技术 羊 裔 高 , (1.成都信息工程学院院长办公室,四川成都 610225;2.成都理 【大学信息工程学院,四川成都 610059) 摘 要:垃圾邮件的泛滥已经严重影响到了人们的生活、工作、学习等方面,因此,反垃圾邮件技术也不断推 出.介绍了几种目前较新的反垃圾邮件技术. 关键词:垃圾邮件;反垃圾邮件技术;病毒 中图分类号:TP 393 文献标识码:A 文章编号:1000—5854(2008)01—0030—03 1 垃圾邮件 电子邮件是Internet主要应用之一,在信息技术应用极其广泛的今天,电子邮件占了越来越重要的地 位,在商业、管理、办公等方面都有不可替代的作用.然而,垃圾邮件的产生,影响了正常电子邮件的通信,占 用了传输带宽,大量宝贵的网络带宽被无效、甚至有害的垃圾邮件所阻塞,用户邮箱被大量垃圾邮件充斥着. 2003年终统计显示:中国邮件服务器总计接收到的垃圾邮件为1 500亿封,用户实际共计收到垃圾邮件470 亿封,经济损失48亿.《第十四次中国互联网络发展状况统计报告》显示,我国网民在2004年7月份每周收 到13.8封电子邮件,其中正常电子邮件为4.6封,垃圾邮件数却达到9.2封….电子邮件服务企业,为治理 垃圾邮件投入了大量的人力、物力、财力和技术,增加了网络企业运营的成本.同时,垃圾邮件的泛滥,也进一 步加剧了病毒的传播,如蠕虫、特洛伊木马等病毒. 邮件传输协议SMTP协议本身是一个简化的邮件递交协议,缺乏很多必要的身份认证,这是SMTP协 议造成垃圾邮件泛滥的原因之一.由于SMTP协议中,允许发信人伪造绝大多数的发信人特征信息,如发信 人、信件路由等,甚至在通过匿名转发、开放转发和开放代理等手段后,可以近乎完全地抹去垃圾邮件的发信 人特征【2J.目前,绝大多数的垃圾邮件都伪造了其真实的发信来源,这对于发现制止垃圾邮件的传播造成了 很大的困难.SMTP协议还缺少一些必要的行为控制,不能有效地甄别正常的邮件发送和垃圾邮件发送行 为,这也是造成垃圾邮件泛滥的原因.宽带网络的快速发展,网络通信成本的下降,成本与产出的巨大反差, 缺乏法律与规范的约束等一系列原因,使得垃圾邮件泛滥. 近年来,我国为治理垃圾邮件做出了很多努力:2002年11月成立了民间的反垃圾邮件协调小组,推出 了《中国互联网协会反垃圾邮件工作规范》;2004年1月,国家四部委联合发文要求整治垃圾邮件和不良信 息;2006年3月,信息产业部出台了《电子邮件服务管理办法》等n].从民间的行业自律到政府的行政法规的 出台,都表明了社会各界已经意识到垃圾邮件的危害. 传统反垃圾邮件技术主要包括关闭开放转发和开启发件认证、关闭匿名代理、静态黑名单与静态白名 单、静态内容过滤、实时黑名单、数量控制等.本文中,笔者介绍了几个较新的反垃圾邮件新技术. 2 反垃圾邮件新型技术 2.1 贝叶斯分析 贝叶斯分析技术的核心是贝叶斯定理. 1)收集大量的垃圾邮件和非垃圾邮件,建立垃圾邮件集和非垃圾邮件集. 2)提取邮件主题和邮件体中的独立字符串,如“办”、“法”等作为TOKEN串,并统计其出现的频率.按 照这个方法分布处理垃圾邮件集和非垃圾邮件集的所有邮件. 3)为每个邮件集对应1个哈希表,hashtable—good对应非垃圾邮件集,hashtable—bad对应垃圾邮件集,表 收稿日期:2007—1O—O8 作者简介:羊裔高(1972一),男,四川绵阳人,讲师,成都理工大学博士研究生,研究方向为计算机网络 · 31 · 中存储TOKEN串到字频的映射关系. 4)计算每个哈希表中TOKEN串出现的概率,即P为某TOKEN串的字频/对应哈希表的长度. 5)计算该邮件为垃圾邮件的概率. 设

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档