网站大量收购独家精品文档,联系QQ:2885784924

海量邮件自动化分析技术的研究与应用-计算机技术专业论文.docxVIP

海量邮件自动化分析技术的研究与应用-计算机技术专业论文.docx

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 作者签名: 日期: 年 月 日 论文使用授权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 (保密的学位论文在解密后应遵守此规定) 作者签名: 导师签名: 日期: 年 月 I I 摘 要 摘 要 电子邮件中蕴含的大量信息让它成为了数据挖掘和大数据分析的重要对象。 利用和分析这些信息成为很多用户所关注的需求。而将原始的邮件文件高效快速 的转化为邮件元数据,并构建一个拥有便于分析和利用海量邮件数据的邮件自动 分析平台,就将为分析和利用好这些信息提供良好的基础。 本文研究了海量邮件自动化分析涉及的关键技术、设计实现了一个海量邮件 自动化分析系统。首先,针对海量内容和自动化这两大需求, 在尽可能不遗漏邮 件文件信息的前提下,建立邮件快速导入模块,分析并归类邮件中的元信息,尽 最大可能的提升导入效率、降低数据规模、提升用户体验和保证信息的完备性, 解决了在海量邮件的前提下处理邮件速度和软硬件基础利用效率的问题,为进一 步开展数据挖掘和分析提供良好的数据条件。其次, 通过深入用户工作实际,发 现在人工分析中存在的流程特点和管理特点,实现对人工分析工作流程的集成, 减少人工分析中不必要的工作和降低程序的运行开销,提升了人工分析部分的信 息化程度。接下来,在邮件元数据、邮件文本信息和分析结果入库的前提下,本 文实现了对上述信息的索引和检索功能,提高了在面对海量邮件信息时快速检索 到感兴趣信息的能力。在此基础上,系统实现了邮件自动化分类标记的功能,整 体提升了系统的自动化能力。此后,本文设计了对感兴趣的信息进行统计和导出 的功能,实现了信息从分解、归类、索引、统计到再次整合的过程。最后,还针 对实际工作环境中的信息管理的具体流程和需要,建立了分角色的信息管理系统, 提升整个工作的信息化程度。 本文对系统部署之后的工作情况做出了统计测试和对比,并对统计和对比结 果反映的问题做出了分析和解释。统计和对比数据表明,系统基本实现了用户的 需求并且可以服务于实际的工作。 最后,本文还总结了海量邮件自动化分析系统需要改进的地方。并为海量邮 件自动化分析系统将来功能的拓展和研究提出了一些自己的想法。 关键字:搜索,海量,电子邮件, 多线程,自动化分类 II II ABSTRACT ABSTRACT E-mail contains a wealth of information which has become an important subject in data mining and big data analysis. Using and analysing the information has become the needs of many users concerning about. Making the original mail file quickly and efficiently converted to the metadata, and building a massive automatic e-mail analysis platform to facilitating the analysis and using of data messages which provide a good basis to make good use of this information. This thesis studied the key technologies which the mass e-mail automated analysis involved, designed and implemented a mass email automated analysis system. At first, because these two demands of the massive content and the automation, this thesis created an e-mail quickly import module, anal

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档