- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两种反垃圾邮件技术剖析
两种反垃圾邮件技术剖析
摘要:在基于内容的反垃圾邮件技术中,基于贝叶斯的反垃圾邮件技术显现了较强的分类能力和较高的准确性,而基于人工免疫系统的反垃圾邮件技术则具有良好的自适应、自学习和鲁棒性,两者的结合在实践测试中取得了良好的效果。
关键词:反垃圾邮件;贝叶斯;人工免疫系统
中图分类号:TP3文献标识码:A文章编号:1009-3044(2010)21-6083-02
Analysis on Two Kinds Of Anti-spam Technical
WU Peng, WANG Jian
(Dept.of Computer Science and Technology, Sichuan Engineering Technical College, Deyang 618000, China)
Abstract: In the content_based anti-spam technology , which is based on bayesreveals its strong categorization, high precision character, which is based on AIS(Artificial Immune System ) reveals its outstanding adaptive, self-learning and robust character. The anti-spam filtering system that is based on bayes and AIS has been proved to be effective in the practical tests.
Key words: anti-spam; bayes; artificial immune system
随着互联网应用的推广,电子邮件作为人们交流的一种常用工具被更多的人使用,与此同时,那些收件人事先没有提出要求或者同意接收的广告、电子刊物、各种宣传性的信息甚至病毒、恶意代码、色情、反动等不良信息或有害信息也以电子邮件为载体在互联网中广泛地传播,这些电子邮件我们俗称垃圾邮件,它们污染着互联网的文明环境,影响企业和个人的正常工作和生活,因此,对垃圾邮件进行综合治理显得意义重大。
根据中国互联网协会反垃圾邮件中心的《2008年第三季度中国反垃圾邮件调查报告》显示,中国网民平均每周收到垃圾邮件的数量为17.86封,所占比例为57.89%,.垃圾邮件仍然以高比例存在于电子邮件中。对于电子邮件这样一个有效通信资源的利用总是无时无刻地进行着,也就必然存在着符合或者违背收件人主观意愿的行为,其目的只有一个:让收件人知晓一些信息。站在反垃圾邮件的角度,我们自然希望是利用电子邮件解决通信双方正当、合法的通信需求,维护通信环境的高效、文明;而对于垃圾邮件制造者或者发送者来说,电子邮件却作为承载着利益甚至阻碍文明发展的工具被利用着,所以他们也会不惜一切代价地去规避现有的反、防措施,去制造一些新的手段多样化的垃圾邮件,不过无论垃圾邮件如何包装、掩饰,它始终都包含属于垃圾的部分,这点是我们反垃圾邮件的根本和着力点。
1 贝叶斯相关理论
贝叶斯方法以概率理论为基础,用于处理统计学中不确定性问题。
对于概率公式:
(1)
其中,A,B表示两个事件,且P(A)0,该公式表示在事件A发生的前提下事件B发生的条件概率。
在此基础上,有贝叶斯(Bayes)公式如下:
(2)
其中B1,B2,…,Bn为一系列互不相容事件,且P(Bi)0(i=1,2,…,n)。
一般而言,人们能根据历史经验或主观判断给出某些事件发生的概率,这样的概率没有经过检验,被称之为先验概率。贝叶斯方法则是利用贝叶斯公式,结合调查、统计、实验等方式获取新的信息,对先验概率进行修正,从而得到更符合实际的可能发生概率的预计。
基于贝叶斯的统计分析技术常常被应用于各行各业的分类应用系统中,因其模型塑造简单易行,运行效果良好而广受欢迎。
2 人工免疫系统(Artificial Immune System,AIS)[1]的相关理论
生物免疫系统是一个高度进化的生物系统,它旨在区分外部有害抗原和自身组织,从而清除病原并保持有机体的稳定[2]。而AIS则是以此为原型从计算的角度产生的面向应用的计算模型。
AIS的免疫算法一般步骤为:
1) 定义抗原:将有待解决的问题抽象成抗原,抗体则对应为问题的求解。
2) 产生初始抗体:抗体与抗原之间的亲和度对应问题的评估:亲和度越高,说明解越好。
3) 计算亲和度:计算抗原与抗体之间的
文档评论(0)