- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
archsummit北京-《sql-on-hadoop方案在freewheel的实践》-林明
SQL-on-Hadoop在FreeWheel的实践
FreeWheel数据平台部 林明
我们的业务
广告销售 广告结算 广告执行
•库存预测 •广告创意管理 •广告测量
•投放预测 •用户画像 •业务报表
•广告预案管理 •受众定向 •广告结算
•广告订单管理 •跨屏广告投放 •合作伙伴分成
•销售流程管理 •广告投放优化 •商业智能分析
单日投放近10亿次广告,生成2TB广告投放数据
Ad-hoc数据分析
• 应用场景
– 咨询团队分析客户业务
– 客户服务团队解决客户问题
– 工程师团队分析线上问题
• 业务需求
– 可以同时分析多个数据源
– 获取多维度和多时间跨度的分析结果
– 在几分钟甚至几秒内完成
SQL-on-Hadoop解决方案
查询接口(SQL )
MPP查询引擎
连接器(Connector )
存储(HDFS )
候选方案
• MPP查询引擎
– Impala/Stinger/Drill/Hive/Presto等
• 存储格式
– 列组/ORC/Parquet等
我们的选择
• MPP查询引擎: Presto
– 非常快的查询速度
– 支持对不同的数据源进行join 操作
– 方便二次开发
• 存储格式:Parquet
– 支持复杂的嵌套数据结构
– 高效的记录碎片化(shred )与装配(assembly )
– 高效的压缩
– 开发社区活跃
Ad-hoc数据分析系统
SQL查询接口
Presto查询引擎
协调节点 计算节点
Parser/Anal Logical Distributed Node
Task
yzer Planner Planner Scheduler
连接器
分块管理器(split manager) 记录游标(Record cursor)
元数据
API 翻译层
数据块元数据缓存
数据注入与存储
匹配器
(matcher) HDFS
数据注入
播放器 广告管理器 广告服务器
请求
文档评论(0)