hadoop版本差异详解.docx.pptxVIP

  • 11
  • 0
  • 约2.3千字
  • 约 7页
  • 2021-01-11 发布于未知
  • 举报
Hadoop 版本的关键特性调研报高 ApacheHadoop Apache 版本衍化 ApacheHadoop 版本分为两代,我们将第一代 Hadoop 称为 Hadoop1.0,第二代 Hadoop 称为 Hadoop2.0。第一代 Hadoop 包含三个大版本,分别是 0.20.x,0.21.x 和 0.22.x, 其中,0.20.x 最后演化成 1.0.x,变成了稳定版,而 0.21.x 和 0.22.x 则 NameNodeHA 等新的重大特性。第二代 Hadoop 包含两个版本,分别是 0.23.x 和 2.x,它们完全不同 于 Hadoop1.0,是一套全新的架构,均包含 HDFSFederation 和 YARN 两个系统,相比于 0.23.x,2.x 增加了 NameNodeHA 和 Wire-compatibility 两个重大特性。经过上面的大 体解释,大家可能明白了 Hadoop 以重大特性区分各个版本的,总结起来,用于区分 Hadoop 版本的特性有以下几个: (1)Append 支持文件追加功能,如果想使用 HBase,需要这个特性。 (2)RAID 在保证数据可靠的前提下,通过引入校验码较少数据块数目. (3)Symlink 支持 HDFS 文件链接 (4)SecurityHadoop 安全。 需要注意的是,Hadoop2.0 主要由

文档评论(0)

1亿VIP精品文档

相关文档