- 6
- 0
- 约 7页
- 2017-05-13 发布于江苏
- 举报
hadoop开发培训之国外、国内Hadoop的应用现状
摘要:Hadoop是一个开源的高效云计算基础架构平台,其不仅仅在云计算领域用途广泛,还可以支撑搜索引擎服务,作为搜索引擎底层的基础架构系统,同时在海量数据处理、数据挖掘、机器学习、科学计算等领域都越来越受到青睐。本文将讲述国外、国内Hadoop的主要应用现状。
国外Hadoop的应用现状
1.Yahoo
Yahoo是Hadoop的最大支持者,截至2012年,Yahoo的Hadoop机器总节点数目超过42?000个,有超过10万的核心CPU在运行Hadoop。最大的一个单Master节点集群有4500个节点(每个节点双路4核心CPUboxesw,4×1TB磁盘,16GBRAM)。总的集群存储容量大于350PB,每月提交的作业数目超过1000万个,在Pig中超过60%的Hadoop作业是使用Pig编写提交的。
Yahoo的Hadoop应用主要包括以下几个方面:
支持广告系统
用户行为分析
支持Web搜索
反垃圾邮件系统
会员反滥用
内容敏捷
个性化推荐
同时Pig研究并测试支持超大规模节点集群的Hadoop系统。
2.Facebook
Facebook使用Hadoop存储内部日志与多维数据,并以此作为报告、分析和机器学习的数据源。目前Hadoop集群的机器节点超过1400台,共计11?200个核心CPU,超过15PB原始存储容量,
您可能关注的文档
- 2015年公需科目:《专业技术人员积极心理健康培养与训练》考试方法及题库.doc
- 2015年公需科目:专业技术人员积极心理健康培养与训练考试最全试题 (包你过关).doc
- 2015年广东省初中毕业生学业考试历史试卷.doc
- 2015年广西科学的研究与技术开发计划课题申报书(格式).doc
- 2015年中传新媒体02网络舆情03网络与未来社会04社会化媒体考研考试科目(初试).doc
- 2015上海公务员考试常识3000问(七).doc
- 2016年昆明教师招聘考试复习资料六.doc
- 2016年最新广东省电子商务高新技术模拟考试试题.doc
- 5774例临床生育不良者异常染色体核型的分析.doc
- 8086微机原理课程设计_压力测量系统设 有硬件电路图计.doc
- 2022年重庆一中高考历史考前适应性试卷.pdf
- 深圳的生物多样性保护(2026)-深圳市生态环境局.pptx
- 2026年ASCO生物医学追踪数据监测医疗保健规划师 2026 Biomedtracker Datamonitor Healthcare ASCO Planner.pptx
- 模板安全设施设计专篇正文(初稿).pdf
- 北京市朝阳区2022-2023学年高三上学期期末生物试卷.pdf
- 北京市东城区2022-2023学年高三上学期期末语文试题.pdf
- 北京市平谷区2022-2023学年高二上学期期末语文试卷.pdf
- 北京市顺义区2022-2023学年高二上学期期末质量检测化学试题.pdf
- 北京市西城区2022-2023学年高三上学期期末语文试题.pdf
- 福建省福州第四中学2022-2023学年高二上学期期末考试化学试卷.pdf
原创力文档

文档评论(0)