TalkingData-大数据下的大表JOIN计算和优化
大数据下的大表JOIN计算和优化
TalkingData Tech VP 周海鹏
2014-10
“人们”眼中的TalkingData
App Analytics Game Analytics Mobile Ad Tracking Enterprise
移动应用统计分析 游戏运营分析 移动广告监测 企业级解决方案
l 应用款数 11500+ l Top盈收游戏 35%覆盖 l 网盟对接 49家 l 两大一线应用市场
l 累计覆盖 7.5亿 + l 玩家覆盖 2.5亿 + l 行业广告主 40%覆盖 l 三大运营商
l 日活设备 2500万 + l 日活玩家 1000万 + l 日监测点 1500万点击 l 四大银行
移动大数据
业务模型
广告行业
移动互联网 投放、优化、
数据 防作弊
人口统计学 O2O
信息 旅游、餐饮、社区
游戏
TalkingData 虚拟生活
大数据平台
Web 金融、证券
浏览日志
日常生活
汽车、健康
数据
服务
移动大数据
我们面临的需求和挑战(3个V )
8亿设备 秒级别查询 多维查询
2500W日活 分钟级别更新 交互式查询
移动大数据
传统技术体系和缺陷
u 大数据量查询速度慢
u 大集群构建成本高昂
u 多维交叉计算能力低效
u 流式计算无法回朔
移动大数据
大表Join操作的难点和解决思路 :Bitmap
u 以Bitmap计算替换原始日志扫描 (优化存储 ,降低成本 )
Hash join
u 高效的内存计算(优化速度 ,优化功能 ) hash
您可能关注的文档
- SPI读写串行FLASH.pdf
- Solid edge ST7的动画与渲染.pdf
- SOPHO-iS3000_and_SIP@Net中文.pdf
- Splunk-6.2.1知识管理器手册.pdf
- Splunk-6.4.0-zh_CN-12知识管理器手册-Knowledge.pdf
- Splunk-6.4.0-zh_CN-3容量规划手册-Capacity.pdf
- Splunk-6.4.0-zh_CN-7分布式管理控制台手册-DMC.pdf
- SPSS-Chap05第五章:SPSS的描述统计过程.pdf
- SPM500PC 阿立瓦喷浆机培训手册.pdf
- spss数据采集与统计整理.pdf
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
原创力文档

文档评论(0)