基于最大熵方法的垃圾邮件过滤插件的设计与实现..docVIP

基于最大熵方法的垃圾邮件过滤插件的设计与实现..doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于最大熵方法的垃圾邮件过滤插件的设计与实现..doc

基于最大熵方法的垃圾邮件过滤插件的设 计与实现 结合邮件的半结构化特征,将最大熵模型引入垃 圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤系统 框架。在此基础上,将其与Outlook提供的PIA相结合,利 用.NET技术开发出基于最大熵模型的垃圾邮件过滤插件,在 客户端实现了基于内容的垃圾邮件过滤,较好地解决了垃圾 邮件的问题。 关键词:最大嫡模型;邮件过滤;.NET; Outlook插件 电子邮件以其方便、快捷、低成本等优点逐渐成为人们 日常生活中主要的通信手段之一。但大量垃圾邮件的出现, 给全球用户带来了巨大损失。据调查,我国用户平均每人每 周收到的垃圾邮件数量占收到的总邮件数量的%[1]。垃圾邮 件的泛滥已带来严重后果,因此有效地区分正常邮件和垃圾 邮件成为一项紧迫的任务。近年来,有关垃圾邮件过滤技术 的研究逐渐兴起。常见的过滤方法有黑、白名单技术和规则 过滤等,但由于邮件发送者在不断变化,规则难以维护,准 确率不高,使这些方法都具有一定的局限性。将垃圾邮件过 滤与机器学习、文本分类和信息过滤技术相结合,对邮件正 文内容进行分析,已成为目前研究的热点[2]。 最大熵模型是一种广泛应用于统计自然语言处理领域 的技术。结合邮件的半结构化特性,本文将最大熵模型应用 到垃圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤 系统框架,并将其与Out look相结合,基于.NET平台开发出 了 Outlook垃圾邮件过滤插件,在客户端利用最大嫡模型实 现了基于内容的垃圾邮件过滤。 1基于最大熵模型的垃圾邮件过滤 1最大熵模型 1互操作程序集 .NET框架中提供的COMInterop技术,使开发人员可以 在.NET代码中直接访问COM组件。其基本原理[4]是,针对用 户要访问的COM组件,.NET框架自动生成一个互操作程序集。 IA是一个完全的托管程序集,其命名空间、类、方法等都与 COM组件相对应。这样,在.NET程序中可以直接引用IA,由 IA完成对真正 IA完成对真正COM组件的访问 2说明了 IA的作用 微软公司为Out 1 ookXX提供了一个“正式的”互操作程 序集,即主互操作程序集,驻留在名称为的全局程序集缓存 中。在Outlook的安装过程中,选择NET可编程性支持”, 或者下载客户端PIA安装包来完成PIA的安装[5]。 2 0utlookXX对象模型 Out look通过对象和对象集合的层次系统为开发语言提 供功能,开发人员利用可用的对象和功能与Outlook进行交 互,创建自己的解决方案。下面对其中几个重要的对象进行 介绍[6]。 2.2. lApplication 对象 A pplication是层次结构中所有其他对象的根,提供对 其他所有Outl ook对象的访问。要从外部应用程序中访问 Outlook对象模型,必须先获得Application对象的实例。 2. 2. 2Namespace 对象 Namespace对象是Outl ook数据源的抽象根。如果要访 问Ou tlook数据,则必须创建Names pace对象的实例。目 前,所支持的唯一数据源是邮件应用程序编程接口 MAP I, 用于访问Outlook文件夹组中的所有Outlook数据。 2. 2. 3MAPIFolder 对象 Ou tlook数据存储区内有一组支持默认功能的文件夹, 使用Namespace的GetDefaultFolder ()方法返回某个默认文 件夹,即MAPI Folder对象。 2.2. 4It ems 对象 Items代表Outl ook项目集合,如邮件项目Maili tem、 任务项目Taskltem等。可以使用Application对象的 CreatEitemO创建新的项目或使用Items对象的索引器获得 并修改现有的项目。 2. 2. 5Expl orers 和 Inspectors 对象 Outlook对象模型还定义了用来对用户界面进行操作的 类型。Expl orers对象包含一组Explore r对象,代表所有 的浏览器。Explo rer类型表示用于显示文件夹内容的窗口。 Inspectors对象包含一组Inspector对象,代表所有检查器。 Inspector对象代表显示0 utlook项目的窗口。 2. 3用.NET开发Outlook插件 利用PIA,开发人员可以在.NET中方便地对Outlook的 编程接口进行操作[7]。VisualH提供了 “共享的外接程序” 项目模板,通过创建自定义外接程序,对OutlookXX进行功 能扩展。完成共享的外接程序向导后,得到包含两个项目的 解决方案,即外接程序项目和对应的安装项目。 外接程序自动引用程序集。它包含命名空间Ext ensibility。其中确切定义了

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档