- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
N 新应用
ew Application
用大数据武装”云”:基于云计算
的大数据处理技术
□张焰 李杨 新华通讯社技术局
【摘要】 随着互联网、移动互联网和物联网的发展,我们已经迎来了数据大爆炸的时代,数据的快速增长带来了数据存储、处理、
分析的巨大压力,而大数据技术(Big data )的引入,不但满足了系统功能和性能的要求,带来良好的可扩展性,降低了 IT 部署的成本,
还拓展了数据智能分析的应用领域。同时,大数据分析与云计算的发展密切相关,云计算是大数据处理的基础,而大数据技术是云计
算的延伸,云计算的分布式存储和计算架构为大数据的快速处理和智能分析提供了一种合适的解决方案。本文将探讨建立在云计算基
础上的大数据处理技术,包括分布式计算框架、分布式文件系统、大数据管理技术、实时流数据处理、机器学习以及可视化技术等。
【关键词】 云计算 大数据 MapReduce Hadoop
一、大数据 越传统 的数据库软件工具 。Hadoop 经常在构建大数据解决
1.1 什么是大数据 方案时被用作基础构架软件 。
大数据概念可以从 四个维度去解 ,即三个 V 和一个 C。 二、大数据技术综述
三个 V 分别指的是数据量大 (Volume )、数据种类多 (Variety ) 大数据处理不仅仅是 Hadoop ,许 多特定 的数据应用场
和数据增长速度快 (Velocity ),最后一个 C 指 的是处理 、 景是需要实时分析和互动反馈 的,这时候就需要利用包括 内
升级或利用大数据 的分析手段 比处理结构化数据要复杂的多 存检索、流处理和实时计算等其他技术 。而云计算 的分布式
(Complexity )。大数据分析常和云计算联 系到一起 ,因为 存储和计算架构开启 了大数据技术研究 的大门,打造健全 的
实时的大型数据集分析需要像 Map-Reduce 一样 的并行计算 大数据生态环境 ,所有这些技术结合在一起 ,才是一个完整
框架将复杂的计算任务分配到 “云”中成百上千的节点。 的大数据处理系统 。
1.2 大数据与云计算 2.1 分布式计算框架
大数据本身就是一个 问题集 ,云计算技术是 目前解决大 MapReduce 是 Google 开发的一种简化的分布式编程模型
数据问题集最重要最有效 的手段 。云计算提供 了基础 的架构 和高效 的任务调度模型 ,用于大规模数据集 (大于 1TB )的
平 台,大数据应用在这个平 台上运行 。 目前公认为分析大数 并行运算 ,使云计算环境下的编程变得十分简单 。
据集最有效手段 的分布式处理技术 ,也是云计算思想 的一种 MapReduce 将数据处理任务抽象为一系列的 Map (映射 )
具体体现。 和 Reduce (化简 )操作对 。Map 主要完成数据的分解操作 ,
云计算是分布式处理 、并行处理和网格计算 的发展 ,或 Reduce 主要完成数据的聚集操作.输入输出数据均以 〈key ,
者说是这些计算机科学概念 的商业实现。云计算将 网络上分 value 〉格式存储.用户在使用该编程模型时 ,只需按照 自己
布的计算 、存储 、服务构件 、网络软件等资源集 中起来 ,基 熟悉 的语 言实现 Map 函数 和 Reduce 函数 即可 ,MapReduce
于资源虚拟化的方式 ,为用户提供方便快捷 的服务 , 实
您可能关注的文档
- 伊朗核谈判困境下的美伊博弈.pdf
- 医护药责任一体化管理对口服乙型肝炎抗病毒药物病人依从性的影响.pdf
- 医护一体化工作模式运用的研究进展.pdf
- 医护一体化品管圈在胸外科管道护理中的应用效果分析.pdf
- 医护一体化在骨科慢性感染伤口中的应用.pdf
- 医疗卫生信息化中云计算应用探讨.pdf
- 医学检验专业理实一体化教学的实践与探讨.pdf
- 医院健康管理科健康管理一体化服务模式初步探讨.pdf
- 医院社区家庭一体化腹膜透析护理研究进展.pdf
- 依法传播应成新闻舆论场新常态.pdf
- 剧本杀行业报告:内容创作规范与剧本市场拓展策略.docx
- 剧本杀行业区域市场区域文化特色与市场潜力分析报告.docx
- 剧本杀行业区域市场拓展实战案例研究.docx
- 剧本杀行业区域市场拓展路径与模式探索报告.docx
- 剧本杀行业区域市场竞争态势与品牌差异化策略研究报告.docx
- 剧本杀行业2025年西北区域市场市场细分领域竞争态势与品牌竞争策略分析研究报告.docx
- 剧本杀行业2025年西北市场拓展前景预测报告.docx
- 剧本杀行业2025年长沙市场发展潜力分析报告.docx
- 剧本杀行业2025年长三角市场竞争策略与布局分析.docx
- 医疗行业数据合规:2025年数据安全法实施后的合规监管挑战与应对.docx
文档评论(0)