- 1
- 0
- 约4.99千字
- 约 15页
- 2019-06-07 发布于北京
- 举报
六个超大规模Hadoop部署案例
虽然Hadoop是眼下热闹非凡的大数据领域最热话题,但它肯定不是可以解决数据中心和数据管理方面所有难题的灵丹妙药。考虑到这一点,我们暂且不想猜测这个平台未来会如何,也不想猜测各种数据密集型解决方案的开源技术未来会如何,而是关注让Hadoop越来越火的实际应用案例。
案例之一:eBay的Hadoop环境
eBay分析平台开发小组的Anil Madan讨论了这家拍卖行业的巨擘在如何充分发挥Hadoop平台的强大功能,充分利用每天潮水般涌入的8TB至10TB数据。
虽然eBay只是几年前才开始向生产型Hadoop环境转移,但它却是早在2007年就率先开始试用Hadoop的大规模互联网公司之一,当时它使用一个小型集群来处理机器学习和搜索相关性方面的问题。这些涉及的是少量数据;Madan表示,但是就这个试验项目而言很有用;不过随着数据日益增加、用户活动日益频繁,eBay想充分利用几个部门和整个用户群当中的数据。
eBay的第一个大型Hadoop集群是500个节点组成的Athena,这个专门建造的生产型平台可以满足eBay内部几个部门的要求。该集群只用了不到三个月就建成了,开始高速处理预测模型、解决实时问题;后来不断扩大规模,以满足其他要求。
Madan表示,该集群现由eBay的许多小组使用,既用于日常生产作业,又用于一次性作业。小组使用Had
您可能关注的文档
- “非关键型”AI蕴藏巨大机遇 .doc
- 《影响中国大数据产业进程100人》何春涛:企业如何正确用敏捷BI发掘商业价值? .doc
- 《影响中国大数据产业进程100人》康志刚:工业大数据需要重构理论体系 .doc
- 《影响中国大数据产业进程100人》王叁寿:地方大数据发展创新之路 .doc
- 《影响中国大数据产业进程100人》王渝伟:如何玩转法律+大数据,降低大数据企业法律风险? .doc
- 《影响中国大数据产业进程100人》石峰:构建公共信息平台,推进智慧城市大数据综合利用 .doc
- 《影响中国大数据产业进程100人》第54期 张保国:信息化企业的大数据转型之路 ▏百人专访 .doc
- 《影响中国大数据产业进程100人》高瀚昭:用大数据搞定安全3.0? .doc
- 「CDAS 在线」分布式数据库模式与反模式 .doc
- 【干货】大数据量惯用优化方法 .doc
- 广东省深圳市福田区侨香外国语学校2025届数学八上期末经典模拟试题含解析.doc
- 2025届湖南省浏阳市初三下十月阶段性考试试题语文试题含解析.doc
- 江西省江西师大附中2026届高三第六次质量检查生物试题含解析.doc
- 江苏省连云港市灌南县2025年三上数学期末质量跟踪监视模拟试题含解析.doc
- 银川科技学院《社交礼仪》2023-2024学年第一学期期末试卷.doc
- 江苏省南京雨花台区七校联考2025届初三下学期第一次周考语文试题(重点班)试题含解析.doc
- 山东省滨州市十二校2025届高一语文第二学期期末综合测试试题含解析.doc
- 西昌学院《经济法》2021-2022学年第一学期期末试卷.doc
- 邯郸市邯山区2024-2025学年四下数学期末复习检测模拟试题含解析.doc
- 安徽林业职业技术学院《毒理学基础A》2023-2024学年第二学期期末试卷.doc
原创力文档

文档评论(0)