垃圾邮件过滤理论和关键技术研究-计算机应用技术专业毕业论文.docxVIP

下载本文档

0
0
约12.26万字
约 130页
2019-05-18 发布于上海
举报
版权申诉

垃圾邮件过滤理论和关键技术研究-计算机应用技术专业毕业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

中文摘要的并行推理算法，为提高Polytree条件下中大型贝叶斯网络的全局证据传播效率提中文摘要的并行推理算法，为提高Polytree条件下中大型贝叶斯网络的全局证据传播效率提供了一种并行解决方案。(3)研究了不完备证据条件下的参数学习问题，基于标准似然函数构建证据丢失的计算模型，利用z距离近似估计证据丢失导致的误差距离，推导出了包含学习率的EM算法。实验结果表明，新算法与传统处理算法相比，在不降低估计精度的前提下具有更快的收敛速度，能够较好地保证不完备证据条件下可信高效的Bayesian网络参数估计。 3、提出了一种包含核函数的Bayesian参数估计方法，提高了Bayesian参数估计的实用性。结合邮件内容和报文格式两个方面分析和提取邮件的重要特征，建立了对应的Bayesian邮件分类网络。将包含核函数的Bayesian参数估计方法应用到邮件分类网络，在对不同邮件测试集的在线学习试验结果证明，这种新的分类模型能够比较有效地实现垃圾邮件的分类过滤。 4、尝试采用拟合Logistic Regression模型对邮件分类问题建模，并在建模的过程中通过引入偏依赖系数函数模拟了邮件过滤中的偏依赖特性。在不同邮件样本集中的实验结果显示，新的邮件分类模型对垃圾邮件的误报误差和漏报误差具有良好的不对称区分性，因而从算法的层次上实现了具有偏依赖特征的邮件分类器。 5、为了规避目前反垃圾邮件技术在文本关联和内容理解方面所存在的诸多困难，提出从另一个角度研究垃圾邮件分类过滤问题，即从垃圾邮件发送者的行为模式角度出发研究邮件类别。通过从邮件发送者的行为紧密相关的邮件特征提取对应特征向量，并应用支持向量机的方法构建分类函数，提出一种基于行为特征的垃圾邮件模式分类模型。经过仿真实验我们发现采用这种全新的行为特征分类模型判定邮件的类别具有较精确的判定效果和较强的鲁棒性。 6、构建了一个位于邮件服务器前端的、多层次的垃圾邮件过滤系统一 SpamWeeder。SpamWeeder系统集成了本文提出的基于多级属性集的Naive Bayes 邮件分类，基于Bayesian网络的邮件分类，基于Logistic回归模型的邮件分类和基于行为特征的邮件分类等多种方法，各种方法之间相互协作、互相补充，形成一个比较准确、快速、高效、易管理和满足不同个性化要求的反垃圾邮件过滤系统。关键词：垃圾邮件，误报率，漏报率，Bayesian网络，证据理论，核密度估计，支持向量机，Logistic回归 II AbstractNowadays，Spam Abstract Nowadays，Spam flood has become one of the Internet disasters and aroused 口eople，s wide attentions．Since the first spam sprung out in the midge of 1980s，various anti．sp锄strategies and techniques came alone with it and developed rapidly till today． Howev瓯Investigations on anti-spam problems have trapped researchers into锄 c锄1Cert细garden’．Subjective and objective uncertainties universally existed m disCrimin撕ng spams have caused big performance bottlenecks on available automated m撕hjne claSsification and fiRering methods．On the other hand，aRer decade years rcse嬲札people have found in some extent that uncertain intelligent Com】)utmg tecmqucs ale able to handle some uncertain problems in practical englneeru唱 applications．Althrough the theory is not perfect，researchers still keep exploring the rules b姚d t11e uncertainties and have achieved phased successftll results since they beHcVe God would no