- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
支持大数据分析的分布式机器学习系统设计
支持大数据分析的分布式机器学习
系统设计
北京大学 崔斌
北京大学-腾讯协同创新实验室
汇报内容
• 问题背景
• 相关工作
• 系统设计
• 总结
机器学习
机器学习成为挖掘数据价值的主要技术
• 广告推荐
• 文本挖掘
• 视频、图像、语音识别
• 金融、风险管理
挑战
• 个性化医疗
• 大数据 : 训练样本数据量超过单机
处理能力
• 智能城市
• 大模型 :数据稀疏,模型维度与数
据维度在一个量级
应用案例 : 腾讯精准广告推荐
大数据对广告推荐的挑战
月活超过10亿
活跃账户7.8亿
百万级标签
日活1.5亿百万广告位
千亿级 复杂的用户关系链
百亿级 每天推荐请求量
千万级 每秒实时预测的广告数量
手机QQ 广告 微信广告
精准广告推荐
大数据对广告推荐的挑战
超大模型 基本特征 高层特征
(Raw Feature) (High-Level Feature)
特征One-Hot化
特征组合(intersection) • 基本属性
亿级特征维度 用户特征 • 商业兴趣
• 用户关系链 高维度
• 消费力
典型算法 : 特
征
• 广告主 稀疏
广告特征 • 广告创意,关键词…… 组
• 公司,品牌,价格…… 合
召 粗 精 大数据
回 排 排 集
CF LR FM
MF GBD FNN 上下文特 • 大小,可见度
T • 形式 (视频 or 图片)
征 • PC,笔记本,手机,App
您可能关注的文档
最近下载
- 岛津原子吸收分光光度计AA-6300软件硬件基本操作AA-6300-rj手册说明书.pdf VIP
- The Magic of Ordinary Days《平凡岁月的魅力(2005)》完整中英文对照剧本.docx VIP
- 注册税务师备考课件.pptx VIP
- MECG1000心电图机培训.pptx VIP
- 国内外CO2催化转化技术发展现状与未来展望.docx VIP
- 道路运输企业双重预防机制建设资料(安全风险分级管控和隐患排查治理).pdf
- HG∕T 5421-2018 噻唑膦原药(可复制版).pdf
- 括号里最大能填几326题.pdf VIP
- 公司物业服务投标方案(技术方案).docx VIP
- 实验动物学学堂云学堂在线课后题答案.docx VIP
文档评论(0)