- 0
- 0
- 约5.86千字
- 约 4页
- 2018-01-18 发布于河南
- 举报
浅谈开源大数据平台的演变
浅谈开源大数据平台的演变摘要: 一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用、降低使用门槛、带动业界大规模部署的就是Ha ...一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用、降低使用门槛、带动业界大规模部署的就是Hadoop。得益于MapReduce框架的易用性和容错性,以及同时包含存储系统和计算系统,使得Hadoop成为大数据处理平台的基石之一。Hadoop能够满足大部分的离线存储和离线计算需求,且性能表现不俗;小部分离线存储和计算需求,在对性能要求不高的情况下,也可以使用Hadoop实现。因此,在搭建大数据处理平台的初期,Hadoop能满足90%以上的离线存储和离线计算需求,成为了各大公司初期平台的首选。随着Hadoop集群越来越大,单点的namenode渐渐成为了问题:第一个问题是单机内存有限,承载不了越来越多的文件数目;第二个问题是单点故障,严重影响集群的高可用性。因此业界出现了几种分布式namenode的方案,用以解决单点问题。此外,为了实现多种计算框架可以运行在同一个集群中,充分复用机器资源,Hadoop引进了
您可能关注的文档
- 好:产成品核算的品种法、分批法、分步法.doc
- 云计算安全风险分析和服务综述.docx
- VB里的函数,字符,运算符等等内容.doc
- 逆向工程实验2-数据处理或曲面重构.doc
- 中国首个基于自主CPU的国产云计算系统问世.docx
- 面向对象程序设计实验报告 多态性和虚函数、运算符重载.doc
- 数控技术论文案例.doc
- 集合的并交差运算_____数据结构课程设计.doc
- 《CAD实训》报告.doc
- 《十六种CAD、CAE、CAM软件介绍》.doc
- 2026年《委托开发合同范文集锦(通用32篇)》.docx
- 2026年《四月第一天朋友圈说说句子4篇》.docx
- 2026年《二年级小学生评语【33篇】》.docx
- 2026年《团队口号及队名(优秀11篇)》.docx
- 2026及未来5年影碟机面板项目可行性研究报告(市场调查与数据分析).docx
- 2026年及未来5年空罐补涂烘干生产线项目市场数据调查、监测研究报告.docx
- 2026年及未来5年彩色铝合金卷帘门窗项目市场数据调查、监测研究报告.docx
- 2026年《梦想的演讲稿模板集锦(8篇)》.docx
- 2026年《中秋节的高中作文10篇》.docx
- 2026年《会议通知【最新16篇】》.docx
原创力文档

文档评论(0)