- 4
- 0
- 约1.11千字
- 约 8页
- 2017-03-03 发布于天津
- 举报
开源数据仓库HadoopHive
开源数据仓库Hadoop Hive在Facebook中的应用 Hive简介 Hive是基于Hadoop的一个开源数据仓库系统,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,支持超大规模的数据查询分析。 主要用户: Facebook Digg 淘宝 … Hive在facebook的应用 应用范围 报表 在线分析 数据挖掘 。。。 系统规模 640节点 2000T容量 每节点8核、4TB存储 Disks Node Disks Node Disks Node Disks Node Disks Node Disks Node 1 Gigabit 4-8 Gigabit Node = DataNode + Map-Reduce Data Warehousing at Facebook Today Web Servers Scribe Servers Filers Hive on Hadoop Cluster Oracle RAC Federated MySQL 使用情况 数据量统计: 总数据量: ~1.7PB 系统总容量: ~2.4PB 每日新增数据量: ~15TB 6TB 未压缩原始日志 4TB 未压缩的多维数据(每天重新加载) 压缩率: ~5x (gzip, more with bzip) 使用情况统计: 3200 jobs/day w
您可能关注的文档
最近下载
- AP宏观经济学 2012年真题 (选择题+问答题) AP Macroeconomics 2012 Released Exam and Answers (MCQ+FRQ).pdf VIP
- 口渴了-朋友帮你.ppt VIP
- 2021年消防继续教育题目和答案 2021年消防继续教育题库 完整版完整版.pdf VIP
- 灯塔施工方案.docx
- 2019年注册消防工程师继续教育题库.pdf VIP
- (完整word版)2019注册消防工程师继续教育三科试题及答案.doc VIP
- 高钠血症多学科决策模式中国专家共识(2025版).docx VIP
- 2019年消防继续教育试题汇总及答案.docx VIP
- 2019年一级注册消防工程师继续教育三科题库+答案 .pdf VIP
- 一种钛合金离子渗氧的方法.pdf VIP
原创力文档

文档评论(0)