- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
python在互联网广告监测分析中的应用
Python 在互联网广告
监测分析中的应用
@陆丹峰 from AdMaster (精硕科技)
互联网广告简介
* 广告 ,和”游戏”、”电子商务”为互联网三大主要盈利途径
* 广告形式:文字链、静态图片、动态Flash、交互式等
* 投放渠道:门户、搜索、视频、微博、SNS、手机…
互联网广告目的:在线营销
广告监测/数据分析:优化广告主的在线营销策略,提升广告转化率
广告投放
投放数据采集:曝
优化投放策略 光/点击/用户行为
数据
数据分析
数据挖掘
AdMaster 广告数据采集分析架构
曝光/点击
华南 • 用 PyPy 跑 Tornado
/用户行为
• 相比 CPython 性能提升 30%
… • 内存使用大,但无泄露
华北
LVS
实时 HDFS
数据 Hadoop
Nginx Nginx … 汇总
Tornado Tornado …
数据处理(PyPy )
log log 清洗/扩充/回溯
Python 在 Hadoop 处理中的角色
2: 生成脚本
参数 1 Pig 算法1
输入 Python
*处理输入输出 Pig 算法2
*控制 Pig 脚本
5
…
计算结果
3: 执行 MapReduce 计算
• 每天新增 TB 级数据 4: 返回 MR 结果
• 每天对千亿行数据进行 Hadoop
各种维度的计算
微博分析工具 WeiboMaster
• 企业级
• 微博营销分析管理平台
• 新浪 + 腾讯
文档评论(0)