网站大量收购独家精品文档,联系QQ:2885784924

基于 hadoop海量数据分析系统设计与实现毕业论文.doc

基于 hadoop海量数据分析系统设计与实现毕业论文.doc

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于 hadoop海量数据分析系统设计与实现毕业论文

西安电子科技大学 学位论文创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个 人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加 以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研 究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用 过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确 的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名: 日期 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 (保密的论文在解密后遵守此规定) 本学位论文属于保密,在 本人签名: 导师签名: 年解密后适用本授权书。 日期 日期 摘要 随着互联网的不断发展,国内大型互联网公司业务的不断复杂化,分析核心 数据成为了公司发展的关键点,但是公司内部的核心数据原始文件庞大,目前大 部分是通过人工分析得出结论,因此分析处理海量数据成为亟待解决的问题。 本文研究了海量数据处理的国内外现状,阐述了分布式 MapReduce 的编程思 想,介绍了 Hadoop 的相关技术和 HDFS 文件系统,分析了企业的需求,使用了 spring- mvc 和 hibernate 等 Web 开发框架对系统进行了分层设计,将系统分成了展 现层、业务逻辑层、数据对象实体层、底层数据层和原始资源层。然后对系统结 构展开设计和实现,结合实际业务设计了分布式 Hadoop 计算模块、数据结果存 储模块和业务系统逻辑模块三个模块,最后对各个模块进行了测试,实现海量数 据分析系统。 本文所做工作被用于大型互联网公司系统的开发。实践表明,采用本文所设 计的系统后,提高了数据分析的效率,改变了人工计算海量数据的情况,实现了 数据分析统计的高效性和集中性。 关键词:Hadoop MapReduce 数据分析 Abstract With the continuous development of the Internet, business of a large domestic company is going to be more and more complex. Analysis of core data becomes a key point of the development of the company, but the internal core raw data files are huge. They get the conclusion by manual analysis. Therefore, analysis and processing massive data become problems to be solved. In this paper, we research the home and ab road status for massive data processing. The MapReduce distributed programming idea is elaborated. We introduce technologies about Hadoop and the HDFS file system, analysis of the needs of enterprises. Spirng-Mvc and Hibernate web development framework are applied to hierarchical designing in the system. The system is divided into five layers : view layer,business logic layer,data object layer,underlying data layer and original resource layer. Then we expand the design and implementation of the system structure. Hadoop calculation module, data storage module and business system module are desig

文档评论(0)

133****9031 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档