Hadoop实战高之路:从零开始的第一讲Hadoop图文训练课程:10钟理解云计算分布式大数据处理框架Hadoop.docxVIP

  • 5
  • 0
  • 约2.53千字
  • 约 5页
  • 2016-08-18 发布于贵州
  • 举报

Hadoop实战高之路:从零开始的第一讲Hadoop图文训练课程:10钟理解云计算分布式大数据处理框架Hadoop.docx

Hadoop实战高之路:从零开始的第一讲Hadoop图文训练课程:10钟理解云计算分布式大数据处理框架Hadoop

智者说,要想最快的进步,主要有两点: 1,向第一名学习,向有结果的人学习; 2,采用持续的、大量的、有决心的行动。。 家林会带您在10分钟内理解云计算分布式大数据处理框架Hadoop并开始动手实践,倒计时开始…… 第1分钟: Hadoop要解决的问题是什么? 答:Hadoop核心要解决长期IT界乃至人类社会的两大主题: 1, 海量数据的存储:传统的存储方式昂贵而且日益难以满足核裂变级别数据的增长,例如纽约证券交易所每天要产生T级别的数据量,Facebook要每天要服务过亿的用户(其中图片等数据`量是惊人的),如何使用廉价的设备支持无线增长的数据的安全高效的存储,Hadoop提出了解决方案,即HDFS. 2, 海量数据的分析:如何有效而快速的从海量数据中提取出有价值的信息,Hadoop给出了解决方案,即MapReduce. HDFS和MapReduce是Hadoop整个项目的基础和核心,Hadoop庞大的家族中的其它子项目都是基于HDFS和MapReduce,所以掌握HDFS和MapReduce也就掌握了Hadoop的核心。 第2分钟: Hadoop的来源和发展历史是什么? 答:始于2002年Apache搜索引擎项目Nutch,2004年Nutch的开发者基于Google发表的著名的GFS论文开发出了开源版本的GFS即NDFS,2005年基于Google发表的著名的Ma

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档