archsummit北京-《sql-on-hadoop方案在freewheel的实践》-林明.pdf

archsummit北京-《sql-on-hadoop方案在freewheel的实践》-林明.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
archsummit北京-《sql-on-hadoop方案在freewheel的实践》-林明

SQL-on-Hadoop在FreeWheel的实践 FreeWheel数据平台部 林明 我们的业务 广告销售 广告结算 广告执行 •库存预测 •广告创意管理 •广告测量 •投放预测 •用户画像 •业务报表 •广告预案管理 •受众定向 •广告结算 •广告订单管理 •跨屏广告投放 •合作伙伴分成 •销售流程管理 •广告投放优化 •商业智能分析 单日投放近10亿次广告,生成2TB广告投放数据 Ad-hoc数据分析 • 应用场景 – 咨询团队分析客户业务 – 客户服务团队解决客户问题 – 工程师团队分析线上问题 • 业务需求 – 可以同时分析多个数据源 – 获取多维度和多时间跨度的分析结果 – 在几分钟甚至几秒内完成 SQL-on-Hadoop解决方案 查询接口(SQL ) MPP查询引擎 连接器(Connector ) 存储(HDFS ) 候选方案 • MPP查询引擎 – Impala/Stinger/Drill/Hive/Presto等 • 存储格式 – 列组/ORC/Parquet等 我们的选择 • MPP查询引擎: Presto – 非常快的查询速度 – 支持对不同的数据源进行join 操作 – 方便二次开发 • 存储格式:Parquet – 支持复杂的嵌套数据结构 – 高效的记录碎片化(shred )与装配(assembly ) – 高效的压缩 – 开发社区活跃 Ad-hoc数据分析系统 SQL查询接口 Presto查询引擎 协调节点 计算节点 Parser/Anal Logical Distributed Node Task yzer Planner Planner Scheduler 连接器 分块管理器(split manager) 记录游标(Record cursor) 元数据 API 翻译层 数据块元数据缓存 数据注入与存储 匹配器 (matcher) HDFS 数据注入 播放器 广告管理器 广告服务器 请求

文档评论(0)

牛X文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档