- 0
- 0
- 约2.85千字
- 约 17页
- 2015-08-29 发布于贵州
- 举报
* 淘宝分布式数据处理实践 主要内容 淘宝的数据 云梯介绍 对Hadoop的主要功能扩展与改造 Hive实践 对Hive的改造 分布式数据仓库构思 淘宝的数据 Oracle 备库 MySQL 备库 日志系统 云梯1 TimeTunnel JDBCDUMP 数据平台 搜索 支付宝 B2B 云梯2 Gateway Servers 数据魔方 量子统计 口碑 DataExchange 爬虫数据 Map Reduce Java Jobs Streaming Jobs Hive Jobs 广告 BI 淘数据 推荐系统 搜索排行 … 淘宝数据的形状 核心数据来源于Oracle备库 大部分数据结构化,数据具有模式 稠密 云梯1规模 总容量9.3PB, 利用率77.09% 总共1100台机器 Master:8CPU(HT),48G内存,SAS Raid Slave节点异构 8CPU/8CPU(HT) 16G/24G内存 1T x 12 / 2T x 6 / 1T x 6 SATA JBOD 12/20 slots 约18000道作业/天, 扫描数据:约500TB/天 用户数474人, 用户组38个 云梯1规模-slave Slave机器异构 6T机器磁盘利用率较高 Rebalance 单机速度控制:10M/s 每天9:00 ~ 23:30运行 Slave故障率 每周10 ~ 20次硬盘
您可能关注的文档
最近下载
- 第五章-药物发现的虚拟筛选方法.pptx VIP
- 湘教版八年级地理下册教学课件《7.4长江经济带的协同发展》.pptx VIP
- Mole节点电容式微动仪.pdf VIP
- 2025年浙江宁波市交通建设工程试验检测中心有限公司招聘笔试参考题库附带答案详解.pdf
- 关于XX法学院“十五五”发展规划(完整版).pdf
- ac-121-102r1大型飞机公共航空运输机载应急医疗设备配备和训练.pdf VIP
- 贝壳找房科技有限公司激励机制对员工离职倾向的影响研究.docx VIP
- 市政工程二级建造师继续教育题库.docx VIP
- 2017年刑法新规定224条.doc VIP
- 陕西专技2026公需课《立足新阶段、抢抓新机遇党的二十届四中全会精神与“十五五”战略机遇解读》20学时完整题库及答案.docx VIP
原创力文档

文档评论(0)