- 10
- 0
- 约5.19千字
- 约 11页
- 2017-01-02 发布于贵州
- 举报
后Hadoop时代的大数据架构背景篇Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括HDFS,MapReduce基本组件。HDFS:提供了一种跨服务器的弹性数据存储系统。MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的输出。Amazon Elastic Map Reduce(EMR):托管的解决方案,运行在由Amazon Elastic Compute Cloud(EC2)和Simple Strorage Service(S3)组成的网络规模的基础设施之上。如果你需要一次性的或不常见的大数据处理,EMR可能会为你节省开支。但EMR是高度优化成与S3 中的数据一起工作,会有较高的延时。Hadoop还包含了一系列技术的扩展系统,这些技术主要包括了Sqoop、Flume、Hive、Pig、Mahout、Datafu和HUE等。Pig:分析大数据集的一个平台,该平台由一种表达数据分析程序的高级语言和对这些程序进行评估的基础设施一起组成。Hive:用于Hadoop的一个数据仓库系统,它提供了类似于SQL的查询语言,通过使用该语言,可以方便地进行数据汇总,特定查询以
您可能关注的文档
- 后备干部总结报告2012.8.后备干部总结报告2012.8..doc
- 后勤服务产业集团落实冬季防火安全会议情况汇总后勤服务产业集团落实冬季防火安全会议情况汇总.doc
- 后定稿东岳海花园标准化工地措施天泰后定稿东岳海花园标准化工地措施天泰.doc
- 后理论时代实用主义的中国当代建筑设计后理论时代实用主义的中国当代建筑设计.doc
- 名师培养工程实施方案名师培养工程实施方案.doc
- 后补外装饰装修及屋面方案 -后补外装饰装修及屋面方案 -.doc
- 后大留学校图书馆专题会议记录后大留学校图书馆专题会议记录.doc
- 吐血整理:二年级下数学易错题吐血整理:二年级下数学易错题.doc
- 吐哈油田公司2003年工作报告吐哈油田公司2003年工作报告.doc
- 向国旗敬礼主题队会活动方案向国旗敬礼主题队会活动方案.doc
原创力文档

文档评论(0)