- 4
- 0
- 约1.11千字
- 约 8页
- 2016-12-13 发布于贵州
- 举报
开源数据仓库Hadoop Hive在Facebook中的应用 Hive简介 Hive是基于Hadoop的一个开源数据仓库系统,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,支持超大规模的数据查询分析。 主要用户: Facebook Digg 淘宝 … Hive在facebook的应用 应用范围 报表 在线分析 数据挖掘 。。。 系统规模 640节点 2000T容量 每节点8核、4TB存储 Disks Node Disks Node Disks Node Disks Node Disks Node Disks Node 1 Gigabit 4-8 Gigabit Node = DataNode + Map-Reduce Data Warehousing at Facebook Today Web Servers Scribe Servers Filers Hive on Hadoop Cluster Oracle RAC Federated MySQL 使用情况 数据量统计: 总数据量: ~1.7PB 系统总容量: ~2.4PB 每日新增数据量: ~15TB 6TB 未压缩原始日志 4TB 未压缩的多维数据(每天重新加载) 压缩率: ~5x (gzip, more with bzip) 使用情况统计: 3200 jobs/day w
您可能关注的文档
最近下载
- 辽宁省沈阳市七中文艺路学校2025-2026学年九年上学期物理零模试题(含答案).docx VIP
- 2023版老年人肌少症防控干预中国专家共识ppt课件.pptx VIP
- 2023版老年人肌少症防控干预中国专家共识.docx VIP
- 全员生发智慧监督系统设计方案.docx VIP
- 全员生发智慧系统落地要领.doc VIP
- AP宏观经济学 2014年真题 附答案和评分标准 AP Macroeconomics 2014 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 4.化学反应与电能.pptx VIP
- E3_series教程演示文件.pdf
- 工程师的安全与健康 Safety and Health for Engineers by Roger L. Brauer.pdf
- 2025年国家电网公司招聘《申论》真题详解卷.docx VIP
原创力文档

文档评论(0)