- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
残缺邮件与完整邮件分离技术的研究
NetSec2004 会议论文
残缺邮件与完整邮件分离技术的研究
张宇 刘挺
(哈尔滨工业大学,哈尔滨 150001)
摘 要:为了保障网络上信息的安全性,需要对网络中的邮件进行检测、封堵和拦截,在此过程中,会产生大量的
残缺邮件,这样会导致后续工作的分析负担加重。为了准确地对残缺邮件进行识别,本文在对 RFC 规范中对邮件格
式规范的分析的基础上,介绍了一种残缺邮件的识别方法,并进行了大量的实验,最后给出了实验结果及分析。
关键词:检测;封堵;残缺邮件;
中图分类号:TP393.098
1 引言
随着互联网应用的普及,电子邮件已逐渐成为现代社会通信的主要手段之一。但随之而来也产生了一些
安全性的问题,其中之一就是大量垃圾邮件的泛滥,这是目前世界各国所面对的一个共性问题。通过对网络
中的邮件进行监测和封堵,可以减少网络中群发邮件的数量。但是在此过程中,在拦截模块对邮件数据包进
行处理时,该数据包也同时进入了监测模块。这样对于一个垃圾邮件而言,在拦截指令发送之前所传送的邮
件数据包已经被监测模块所捕获,虽然后续的邮件内容已被拦截,但监测模块仍会将捕获到的内容进行还原,
由此导致监测模块还原所形成电子邮件将是残缺的。
残缺邮件与完整邮件混杂在一起,使得群发垃圾邮件自动发现算法的分析负担加重,性能下降,并容易
导致误判率的提高。为此需要进行有效的分离操作,将残缺邮件从分析目标集合中去除,以提高监测模块的
分析能力。
本文的组织如下,首先介绍了 RFC 中关于邮件的规范的定义,在此规范的基础上,本文的第三部分详细
介绍了残缺邮件与完整邮件分离的思路,第四部分给出了实验结果和性能测试结果。最后是本文的结论和下
一步的工作。
2 邮件的格式
[1]
根据RFC821 (Simple mail transfer protocol ) 、RFC822 (Standard for the Format of ARPA Internet Text
[2]
Messages ) 、RFC1521 (Mechanisms for Specifying and Describing the Format of Internet Message Bodies)
[3]和RFC1522 (MIME (Multipurpose Internet Mail Extensions) Part Two: Message Header Extensions for
Non-ASCII Text )[4]中关于邮件规范的描述,我们对邮件的格式进行了详细的分析。
在 RFC 规范中,对邮件的格式进行了定义,包括邮件的字符集、邮件传送采用的协议、邮件头的格式等等。
邮件的书写格式和内容多种多样,有的邮件采用的是 HTML 格式书写的,有的邮件则是一般的文本方式,有的
带附件,有的不带附件……。这样,如何区分一个邮件是完整的还是残缺的呢?在 RFC 的关于邮件的规范中,
对邮件头的格式有着很详细的定义。本文中所采用的方法就主要是根据邮件头中 Content-type 的信息来进行判断
的。
由于邮件格式的多样性,RFC1521 种对 MIME 的邮件进行了详尽的定义和说明。邮件的头部包含邮件的发
送者地址、邮件接收者地址、邮件的主题、邮件内容的类型 (Content-type )等信息。由于邮件是否完整主要是看
邮件的内容是否完整,这样判断过程中发送者地址、接收者地址、邮件的主题等信息的利用价值不大。下面简要
介绍一下 Content-type 的定义和说明。
Text Content Type
这种类型的邮件中,邮件的内容是以文本的形式进行发送的,也是缺省的类型。该类型有两种主要的字类型,
NetSec2004 会议论文
一种是“text/plain ”,另一种是“text/html ”。在“text/plain ”中,邮件的正文是以非格式化文本的方式表达的;
“text/html ”中,邮件的正文是以格式化文本进行表达的。
您可能关注的文档
最近下载
- 公司章程英文版 Company Articles of Association.doc VIP
- 英文版公司章程ARTICLES OF ASSOCIATION OF.docx VIP
- 从《倾城之恋》的白流苏透析张爱玲小说中的女性形象.docx
- 档案搬迁服务 投标方案.doc
- 日本 东要介--透析液纯净化.cn.pdf VIP
- mpr300电机保护器使用使用说明书.doc
- 2025年乡村振兴战略下县域经济产业链优化研究报告.docx VIP
- 胜利仪器VICTOR 240.240S.270.270S双通道系列示波器用户手册.pdf VIP
- 智能浇灌系统的策划书3篇.pdf VIP
- 新HSK3级词汇最新分析和总结.pdf VIP
文档评论(0)