美团大数据体系-美团云MOC2015沙龙在线教育02期.pdfVIP

美团大数据体系-美团云MOC2015沙龙在线教育02期.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
美团大数据体系-美团云MOC2015沙龙在线教育02期.pdf

美团⼤数据体系 挑战, 架构, 经验总结 ⺫录 • ⼤数据在美团 • 数据流架构与设计权衡 • 美团数据体系演进 • 经验以及教训 ⺫录 • ⼤数据在美团 • 数据流架构与设计权衡 • 美团数据体系演进 • 经验以及教训 ⼤数据在美团 • ⼤数据是什么 • Volume • Velocity • Variety • Value ⼤数据在美团 • Volume • 4P+ 总存储量 • 30T+ 天增数据量 • 300+ 机器 • 1.3K 机器年度预算 ⼤数据在美团 • Velocity • 秒级别 实时数据流延迟 • 半⼩时 离线数据流延迟 • 分钟级 分析查询延迟 ⼤数据在美团 • Variety • 40K 天均任务数 • 5K 数据仓库数据表数 • 近半年上述指标增量翻倍 ⼤数据在美团 • Value • 600 分析师/运营/数据RD • 500+ 报表 • 2500+ 指标数 • 200% 推荐系统交易额占⽐提升 ⼤数据在美团 • 美团的主要挑战 • 数据量不⼩, 增⻓极快 • 业务变动速度快 • 应⽤模式复杂 • 响应速度要求⾼ • 可⽤性, 正确性要求⾼ • 基础架构演进快 ⺫录 • ⼤数据在美团 • 数据流架构与设计权衡 • 美团数据体系演进 • 经验以及教训 美团数据流架构图 美团数据流架构图 美团数据流架构图 简单聊两句数据仓库 • dim 维度 / 维度表 • ⼀般是指实际存在或虚拟存在的⼀个“东⻄” ,⽐如⽤户、项⺫、商家、品牌、商品、城市、⽇期、部 ⻔、员⼯,以及围绕这个东⻄的各种属性 • fact 事实 / 事实表 • 可以理解为⼀个实际发⽣的事情,⽐如:访问、下单、评论、维权,⽽且,⼀般来说⼀个事实都是两个或 多个维度相关联 • detail 明细表 • 对于事实和维度进⾏细粒度的计算和改进 • summary 聚合表 • 对于⼀系列事实, 按照不同的维度组合, 计算出对应条件下的指标, 并按照维度组合组织, 不同的维度组合相 当于 group by 条件 简单聊两句数据仓库 • aggr 聚合表2.0 • 元数据驱动的数据聚合, 将某个领域事实按照不同的维度组合进⾏聚合 • topic 主题表, ⼤宽表 • 将相同维度组合的聚合表进⾏拼接, 提供统⼀接⼝ 美团数据流架构图 美团数据流架构图 美团数据流架构图 美团数据流架构图 ⺫录 • ⼤数据在美团 • 数据流架构与设计权衡 • 美团数据体系演进 • 经验以及教训 美团数据体系时间线 • 史前时代 • 数据流⼯具, 报表⼯具 • 数据仓库, 调度, 元数据, hadoop • 开放平台, 多应⽤形式 • DW2.0 元数据驱动数据⽣产 美团数据体系演进 • 史前时代 - 11年6⽉前 • 内部信息系统状态

文档评论(0)

牛X文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档