- 2
- 0
- 约2.83千字
- 约 33页
- 2019-07-02 发布于天津
- 举报
回顾关系型数据库仍然是王道分库分表冷热分离是的有益补充用冗余避免网络传输和随机读用中间层隔离前后端异构数据源的整合缓存是系统化的工程数据一致性穿透与雪崩矛盾之美计算时机预算实时计算引擎现算中间层中间层计算场所本地单机集中中间层中间层数据存储冷盘热盘缓存缓存谢谢淘宝海量数据产品技术架构张轩丞朋春淘宝网数据平台与产品部关于张轩丞朋春淘宝数据平台与产品部杭州党脚本语言爱好者关注社区组织者之一我是数据平台与产品淘宝网淘宝卖家供应商消费者搜索浏览收藏交易评价一些数字淘宝主站亿店铺宝贝浏览亿计的在线宝贝数千
* * * * 回顾 关系型数据库仍然是王道 分库分表、冷热分离 NoSQL是SQL的有益补充 用冗余避免网络传输和随机读 用中间层隔离前后端 异构数据源的整合 缓存是系统化的工程 数据一致性、穿透与雪崩 矛盾之美 SQL NoSQL 计算时机 “预算” Hadoop / 实时计算引擎 “现算” MySQL + 中间层 Hbase + 中间层 计算场所 本地 MySQL单机 Hbase Region Server 集中 MyFOX中间层 Prom中间层 数据存储 冷 7200 SATA盘 HDFS 热 15000 SAS盘 + 缓存 HDFS + 缓存 谢谢 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 淘宝海量数据产品技术架构 张轩丞(朋春) 淘宝网-数据平台与产品部 关于 张轩丞(朋春) 淘宝数据平台与产品部(杭州) vi党,脚本语言爱好者 关注NodeJS,cnode社区组织者之一 pengchun@ :我是aleafs 数据平台与产品 淘宝网 淘宝卖家 供应商 消费者 搜索、浏览、收藏、交易、评价... 一些数字 淘宝主站: 30亿店铺、宝贝浏览 10亿计的在线宝贝数 千万量级交易笔数 数据产品: 50G统计汇总结果 千万量级数据查询请求 平均20.8ms的响应时间(6月1日) 海量数据带来的挑战 计算 计算的速度 处理吞吐量 存储 存储是为了更方便地查询 硬盘、内存的成本 查询 “大海捞针” 全“表”扫描 架构总览 主站备库 RAC 主站日志 数据源 MyFOX Prom 存储 层 数据中间层 / glider 查询 层 数据魔方 淘宝指数 开放API 产品 Hadoop集群 / 云梯 计算层 实时流数据 DataX / DbSync / TimeTunnel 1500节点,每日40000 JOB,处理数据1.5PB,凌晨2点结束,结果20T 今天的话题 关系型数据库仍然是王道 NoSQL是SQL的有益补充 用中间层隔离前后端 缓存是系统化的工程 关系型数据库仍然是王道 关系型数据库 有成熟稳定的开源产品 SQL有较强的表达能力 只存储中间状态的数据 查询时过滤、计算、排序 数据产品的本质 拉关系 做计算 SELECT IF(INSTR(f.keyword, ) 0, UPPER(TRIM(f.keyword)), CONCAT(b.brand_name, ,UPPER(TRIM(f.keyword)))) AS f0, SUM(f.search_num) AS f1, ROUND(SUM(f.search_num) / AVG(f.uv), 2) AS f3 FROM dm_fact_keyword_brand_d f INNER JOIN dim_brand b ON f.keyword_brand_id = b.brand_id WHERE keyword_cat_id IN AND thedate = 2011-07-09 AND thedate = 2011-07-07 GROUP BY f0 ORDER BY SUM(f.search_num) DESC LIMIT 0, 100 存储在DB中的数据 分布式MySQL集群 字段+条目数分片 MyISAM引擎 离线批量装载 跨机房互备 云梯 APP MySQL 集群 数据装载 数据查询 MyFOX 透明的集群中间层—MyFOX 透明查询 基于NodeJS,1200QPS 数据装载 路由计算 数据装入 一致性校验 集群管理 配置信息维护 监控报警 MyFOX-数据查询 取分片数据(异步并发) 取分片 结果合并(表达式求值) 合并计算 缓存 路由 SQL解析 语义理解 查询路由 字段改写 分片SQL 计算规则 APC 缓存 X MyFOX-节点结构 MyFOX 热节点(MySQL) 15k SAS盘,300G * 12,raid10 内存:24G 成本:4.5W / T 冷节点(MySQL) 7.2k SATA盘,1T * 12,raid10 内存:24G 成本:1.6W / T 路由表 30天无访问的冷数据 新增热数据 小结 根据业务特点分库分表 冷热数据分离 降低成本,好钢用在刀刃上 更有效地使用内存 SQL虽牛,但是… 如果继续用MySQL来存储数据,你怎么建索引? NoSQL是SQL的有益补充 全属性交叉运算 不同类目的商品有不同的属性 同一商品的属性对有很多 用户查询所选择的属性对不确定 Prometheus 定制化的存储 实时计算 Prom—数据装载 Prom Hbase Hbas
您可能关注的文档
- 事业减废节能及环境教育宣导建筑废弃物篇.ppt
- 二代健保如何计算保险费.ppt
- 二天课程讲解如何运用进行试验配置-Omnex.doc
- 产兆及生产方式-台北立万芳医院.ppt
- 人际冲突-嘉南药理大学综合服务组.ppt
- 今天我们请来了社会各界人士来共同探讨社会舆论和司法审判的关系.doc
- 从电脑到人脑——广州工程技术职业学院-广州工程学院图书馆.ppt
- 代谢性酸碱平衡紊乱.ppt
- 以适当科技与风险的角度来看风力系统.ppt
- 2010年健康教育工作计划-望江疾病预防控制中心.doc
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
最近下载
- 2025年演出经纪人话剧_舞台剧项目收益分配模式专题试卷及解析.pdf VIP
- 2025年演出经纪人演出保险方案的招标与采购流程专题试卷及解析.pdf VIP
- 2025年人力资源管理师残疾人职工就业保障与权益保护专题试卷及解析.pdf VIP
- 2025年信息系统安全专家数据安全生命周期管理专题试卷及解析.pdf VIP
- 2025年碳排放管理师碳边境调节机制零碳工厂建设专题试卷及解析.pdf VIP
- 医疗护理安全警示教育案例.pptx VIP
- 优质护理服务PPT课件.pptx VIP
- 2025年房地产经纪人二手房交易行为规范专题试卷及解析.pdf VIP
- 2025年互联网营销师敏捷项目管理在营销中的应用专题试卷及解析.docx VIP
- 2025年项目管理专业成本补偿合同最新政策解读专题试卷及解析.pdf VIP
原创力文档

文档评论(0)