hadoop分布式集群的自动化容器部署研究-计算机应用研究.pdfVIP

  • 10
  • 0
  • 约2.06万字
  • 约 5页
  • 2018-11-16 发布于天津
  • 举报

hadoop分布式集群的自动化容器部署研究-计算机应用研究.pdf

hadoop分布式集群的自动化容器部署研究-计算机应用研究

第33卷第11期 计 算 机 应 用 研 究 Vol33No11 2016年11月  ApplicationResearchofComputers Nov.2016 Hadoop分布式集群的自动化容器部署研究 李 杰,刘广钟 (上海海事大学信息工程学院,上海201306) 摘 要:针对Hadoop集群部署过程繁琐复杂、耗时费力、运维难度大,且不利于快速扩展的问题,提出一种结合 Docker容器技术部署集群的解决方法。该方法把Ambari及其运行环境和配置构建成Docker镜像,并把多节点 容器的运行和Hadoop集群的部署过程写成Shell脚本,只需一条命令,即可实现集群的自动化部署。实验结果 表明,该方法简单可靠并极大地提高了集群部署的效率。因此,对海量数据的处理和分析具有重要的推动作用。 关键词:Hadoop集群;镜像;自动化部署;Docker容器;大数据 中图分类号:TP399   文献标志码:A   文章编号:10013695(2016)11340404 doi:10.3969/j.issn.10013695.2016.11.045 ResearchonautomaticdeploymentofHadoopdistributedcluster LiJie,LiuGuangzhong (CollegeofInformationEngineering,ShanghaiMaritimeUniversity,Shanghai201306,China) Abstract:Thedeploymentofhadoopclusteriscomplicated,timeconsuminganddifficult,andisnotconducivetotherapid expansionofthecluster.Inordertosolvetheseproblems,thepaperproposedanewsolutionofcombiningdockercontainer basedonfast,simpleandflexibledeploymentofcluster.Dockerimagesbuiltwithambarianditsoperatingenvironmentand configuration.Writeshellscriptwiththemultinodecontainerandprocessofhadoopdeployment.Withonecommand,itcould realizethecrossplatformofarbitrarynodesHadoopcluster’sautomationinstallationanddeployment.Experimentsshowthat theproposedschemeissimpleandreliableandcangreatlyimprovetheefficiencyofclusterdeployment.Asaresult,thepro posedschemehasanimportantroleinpromotingtheprocessingandanalysisofmassdata. Keywords:Hadoopcluster;image;automationdeployment;Dockercontainer;bigdata   随着互联网的发展、互联网用户的增加,互联网中的数据 个容器共享组件,如操作系统镜像和已安装的相关库,这就省 也急剧膨胀。每天产生的数据量数以万计,单个计算机受内 下了安装操作系统和相关应用程序依赖包的时间,极大地加速 存、CPU等硬件的限制,已无法满足存储和计算要求。分布式 了测试周期。另外,在容器之间的共享库也能够减少内存的占

文档评论(0)

1亿VIP精品文档

相关文档