Mariana：腾讯深度学习平台的进展和应用.pdf

下载文档 降价啦

3
0
约5.66千字
约 21页
2019-03-18 发布于山东
举报
版权申诉
保障服务

Mariana：腾讯深度学习平台的进展和应用.pdf

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Mariana: 腾讯深度学习平台进展与应用腾讯-数据平台部-精准推荐中心邹永强 2014-12-14 提纲 腾讯深度学习的应用需求 腾讯深度学习平台的挑战 Mariana 平台概述与技术路线 Mariana DNN的架构与应用 Mariana CNN的架构与应用 Mariana Cluster的架构与应用 Mariana GPU Cluster简介 总结背景：深度学习快速发展 深度学习是近年机器学习中备受瞩目的分支 在语音识别、图像识别等持续取得突破 Eg. ImageNet 1000类图像分类问题：准确率72%85%89%93% 各公司持续发力 基于多层神经网络的复杂模型 模型模拟人脑的结构 模型远复杂于当前的浅层模型 深度学习的发展机遇 海量的数据 高速增长的计算能力腾讯深度学习的应用需求-微信语音识别 微信 WeChat ：月活跃用户4.7亿，2014Q3 语音输入 长按语音消息转文字 语音开放平台腾讯深度学习的应用需求-微信图像识别腾讯深度学习的应用需求-广点通广告 QQ ：月活跃用户8.2亿，2014Q3 QQ空间智能终端：月活5.1亿 微信 QQ空间：月活跃用户6.3亿腾讯深度学习平台的挑战 深度神经网络模型复杂，训练数据多，计算量大 模型复杂：人脑有100多亿个神经绅胞 训练数据多 以微信语音识别为例：超过50,000,000参数，超过4,000,000,000样本 深度神经网络需要支持大模型 更深更宽的网络能获得更好的结果 以图像识别为例，增加卷积层filter数量，加深模型都有改善 深度神经网络训练中超参数多，需要反复多次实验 超参数敏感：模型结构、输入数据处理方式、权重初始化方案、激活函数选择、参数配置等 非线性模型，倚重技巧和经验 Mariana ：腾讯深度学习平台概述 目标 三个框架 主要应用深度学习模型训练的幵行方法 Data 0 Data 1 Data 2 Data 3 数据幵行 划分训练数据 各Worker独自训练 交换参数 Worker 0 Worker 1 Worker 2 Worker 3 模型幵行 Data 模型拆分 多个Worker作为1组 同组Worker训练一个模型 Worker 0 Worker 1 Worker 2 Worker 3 Mariana的设计选择 CPU幵行 vs GPU幵行 对语音识别，1 GPU卡 vs 384 CPU核（32台12物理核的服务器） 数据幵行 vs 模型幵行 语音 vs 图像 同步SGD vs 异步SGD Worker间参数更新方式：有同步点vs 独立地进行 Worker的规模和计算/通信的同步性  One size fits all? No! 针对业务的选择 Mariana三个框架的设计选择框架目标业务计算单元数据并行模型并行 SGD模式 Mariana DNN 语音识别