《基于AIS的中文垃圾邮件处理系统设计与实现》.pdfVIP

  • 7
  • 0
  • 约1.24万字
  • 约 5页
  • 2015-11-08 发布于河南
  • 举报

《基于AIS的中文垃圾邮件处理系统设计与实现》.pdf

《基于AIS的中文垃圾邮件处理系统设计与实现》.pdf

第9卷第2期 南京工业职业技术学院学报 V01.9,No.2 2009年6月 Journalof InstituteofIndustryTechnology Jun.,2009 Nanjing 文章编号:1671—4644(2009)02—0054—04 基于AIS的中文垃圾邮件处理系统设计与实现 黄 珏1’2 (1.南京航空航天大学信息科学与技术学院,江苏南京210016) 2.南京工业职业技术学院信息工程系,江苏 南京210046) 摘要:垃圾邮件在互联网上广泛传播,如何有效地避免和防范垃圾邮件已成为一个亟待解决的问题。受生物免疫 系统的启发,文章提出了一种基于人工免疫的垃圾邮件处理系统,它采用检测器算法,不需要反复训练就可以分辨 出垃圾和非垃圾邮件。实验结果表明,该算法和Bayesian算法相比,分类器对于突然的变化能够快速反应,表现出 更高的动态适应性和系统稳定性,在召回率方面也得到了提高。 关键词:人工免疫(AIS);垃圾邮件;贝叶斯算法;检测器 中图分类号:TP393.098文献标识码:A 次贝叶斯分类器对邮件的分类基于己知样本,其识别率较 引言 高,但是对于未知样本,特别是已有样本的变异样本,识别 随着电子邮件越来越普及的使用,它在给人们带来便捷 效果不甚理想。例如:分类器可以辨认“法轮功”,但是当 的同时,其弊端也更加明显。邮件的泛滥,占用r信箱空 单词变异为“三去车仑工力”时,分类器就不能正确地辨 间,人们要花费一定的时间去处理垃圾邮件,严重影响了正 认,而目前越来越多的垃圾邮件的制造者都采用一些变异的 常的信息交流,垃圾邮件的发送占用大量带宽,影响了网络 单词避开检测器。 的正常运作。更严重的是,垃圾邮件散布一些政治反动言 基于上述原因,本文借鉴生物免疫的保护机制,将人工 论,商业广告消息,甚至,该邮件本身就携带病毒或者木马 免疫模型运用在垃圾邮件处理中,提出了基于人工免疫的垃 程序,对网络系统安全构成了巨大的威胁。 圾邮件处理系统。 1 目前研究现状 2人工免疫系统介绍 针对垃圾邮件泛滥的现状,目前出现了很多反垃圾邮件系 2.1生物免疫系统和垃圾邮件处理系统的对应关系 统。根据过滤器在邮件系统中所处的位置不同,可以分为基于 人工免疫系统(AIS)是继人工神经网络、进化计算之 服务器的过滤和基于客户端的过滤,根据邮件过滤技术不同, 后又一新的软计算研究方向。近年来,人工免疫系统己经迅 可以可分为:基于规则…,基于统计忙1和基于连接po的方法。 速成为信息安全和网络安全的问题的研究热点。 基于规则的方法,如决策树、关联规则等,基于规则的 生物免疫系统是一个由免疫细胞、器官组成的复杂系 过滤多应用于某一具体领域,需要该领域的知识和规则库作 统,免疫系统的主要功能是区分自体和非自体。当抗原入侵 为支撑。但是对知识和规则的制定、更新、维护及自我学习 时,免疫系统就会产生淋巴细胞,抵御抗原。免疫系统具有 等方面存在种种问题,使得应用面比较窄。效果不佳。 自学习,识别抗原,免疫记忆等特点H,。 基于统计的方法,利用纯粹的统计概率原理,采用机器 生物免疫系统和垃圾邮件处理有极其相似之处,表1为 自动学习的方法,通过对已知样本的自动学习,建立特征体 两者之间的对应关系: 系,从而实现对未知样本的推测。如Bayes算法嵋o,目前商 表1 免疫系统和垃圾邮件处理相似之外 用的反垃圾邮件系统大多采用此方法。 Natural EmailIS系

文档评论(0)

1亿VIP精品文档

相关文档