- 1、本文档共90页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Hadoop技术原理与案例
HadoopTechnicalPrinciplesPractices主编:韩玉民郭丽副主编:王尧张文宁张炎峰缑西梅
2.1Hadoop概述2.2Hadoop生态圈2.3Hadoop核心架构2.4Hadoop运行模式2.5Hadoop集群搭建2.6常见问题及解决方案2.7本章小结Hadoop简介分布式存储与计算基础第一篇第2章
Hadoop简介第2章
2.1Hadoop概述2.1.1起源2002年,Apache启动了Nutch项目,该项目是ApacheLucene的子项目之一,其设计目标是构建一个大型的全网搜索引擎,实现网页抓取、索引、查询等功能。2003-2006年,Google先后发布了《TheGoogleFileSystem》、《MapReduce:SimplifiedDataProcessingonLargeClusters》和《Bigtable:ADistributedStorageSystemforStructuredData》三篇论文,公开了部分GFS和MapReduce思想的细节,开启了工业界的大数据时代,奠定了HDFS和MapReduce的思想基础,被称为谷歌大数据的“三驾马车”,也被称为Hadoop的思想之源。2005年Hadoop作为Lucene的子项目Nutch的一部分正式引入Apache基金会。
2.1Hadoop概述2006年2月,MapReduce和NutchDistributedFileSystem(NDFS)分别被剥离出来,成为一套完整独立的软件,Hadoop项目正式启动以支持MapReduce和HadoopDistributedFileSystem(HDFS)的独立发展。2008年1月,Hadoop成为Apache顶级项目。2008年4月,Hadoop成为最快排序1TB数据的系统。2008年6月,Hive成为了Hadoop的子项目。2009年7月,MapReduce和HDFS成为Hadoop项目的独立子项目。2010年5月,HBase成为Apache顶级项目。2010年9月,Hive和Pig成为Apache顶级项目。2.1.1起源
2.1Hadoop概述2011年1月,ZooKeeper成为Apache顶级项目。2011年12月,Hadoop1.0.0版发布,标志着Hadoop已经初具生产规模。2013年10月,Hadoop2.0.0版发布,标志着Hadoop正式进入MapReduceV2.0时代。2017年12月,继Hadoop3.0.0的四个Alpha版本和一个Beta版本后,第一个可用的Hadoop3.0.0版本发布。DougCutting被人们称为Hadoop之父,他曾这样描述过这个名字:“这是我的孩子给他的黄色毛绒小象玩具起的名字。简短易于读写,没有具体意义且没有被别人使用过,这就是我对于项目命名的原则。”2.1.1起源
2.1Hadoop概述由于Hadoop在大数据处理方面的突出表现,许多公司都推出了自己的Hadoop商业版本,以提供更为专业的技术支持。目前Hadoop的发行版本除了Apache的开源版本外,还有Intel发行版、Cloudera发行版及Hortonworks发行版等多种版本。ApacheHadoop版本是最基础的Hadoop版本,适合于初学者。ClouderaHadoop是Cloudera公司提供的Hadoop解决方案,常用于大型互联网企业。HortonworksHdoop是Hortonworks公司的代表产品,是一个企业级的Hadoop发行版,配备了较为完善的支撑文档。2.1.2Hadoop发行版本
2.1Hadoop概述1.ApacheHadoopApacheHadoop也称为Apache社区版本,具备开源免费、社区活跃及资料翔实等优点。ApacheHadoop的官方地址为:,下载地址:/dist/hadoop/common/。2.HortonworksHadoopHortonworksHadoop是Hortonworks公司发行和维护的Hadoop版本。该公司主打产品是HortonworksDataPlatform,包含了ApacheHadoop的所有关键组件,提供了直观的用户界面安装配置工具,在管理工具和集群部署方面有独特优势。2.1.2Hadoop发行版本
2.1Hadoop概述HortonworksHadoop的官方地址为,下载地址为https://cn./downloads.html3.ClouderaHadoopClouderaHadoop基于Ap
您可能关注的文档
- 第1章 大数据基础-2023-8-16.ppt
- 第3章 Hadoop分布式存储系统.pptx
- 第4章 Hadoop分布式计算系统.pptx
- 第5章 Hadoop资源管理器Yarn.pptx
- 第6章 Hadoop案例开发.pptx
- 第7章 Hive原理与应用-12-16.pptx
- 第8章 Hive的数据定义.pptx
- 第9章 Hive的数据分析.pptx
- 第10章 Hive数据分析案例.pptx
- 第11章 HBase基础知识.pptx
- 人教版九年级英语全一册单元速记•巧练Unit13【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit9【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit11【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit14【单元测试·提升卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit8【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit4【单元测试·提升卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit13【单元测试·基础卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit7【速记清单】(原卷版+解析).docx
- 苏教版五年级上册数学分层作业设计 2.2 三角形的面积(附答案).docx
- 人教版九年级英语全一册单元速记•巧练Unit12【单元测试·基础卷】(原卷版+解析).docx
- 大学计算机网络教授老刘 + 关注
-
实名认证服务提供商
教师资格证、中级网络工程师持证人
专注于计算机技术相关文章撰写,方案设计,方案实现等,方案的个性定制,修改,润色等,本人已有8年相关工作经验,具有扎实的文案功底
文档评论(0)