- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大规模分布式机器学习系统设计与应用经验分享
大规模分布式机器学习
系统设计与应用经验分享
涂威威
涂威威大规模分布式机器学习系统设计与应用经验分享 1
目录
机器学习系统
大规模分布式模型训练框架设计
机器学习实际应用的常见陷阱
涂威威大规模分布式机器学习系统设计与应用经验分享 2
机器学习系统
机器学习的经典定义
典型的机器学习应用过程
机器学习的核心系统
涂威威大规模分布式机器学习系统设计与应用经验分享 3
机器学习的经典定义
利用经验改善系统性能
经验 数据
机器学习无处不在
搜索与推荐
生物特征识别
自动驾驶
军事决策助手(DARPA)
…
涂威威大规模分布式机器学习系统设计与应用经验分享 4
典型的机器学习应用过程(广告点击率预估系统为例)
问题定义:收入= 平均每次点击价格* 点击率* 广告展现量
应用过程:数据收集数据预处理模型训练模型服务
数据收集
模型服务
数据预处理
[Sibyl, Google]
模型训练
涂威威大规模分布式机器学习系统设计与应用经验分享 5
机器学习的核心系统
数据收集
模型服务 数据预处理
模型训练
涂威威大规模分布式机器学习系统设计与应用经验分享 6
大规模分布式模型训练框架设计
工业应用模型训练框架设计目标
开发效率:计算模型和编程模型的选择
执行效率:计算优化举例
涂威威大规模分布式机器学习系统设计与应用经验分享 7
机器学习在工业应用中的发展趋势
宏观特征(比如:年龄、性别等)
有效数据的增长
频
数据量: ~
度
特征维度的增长 长尾特征(比如用户ID等)
宏观特征( ) 微观特征( ~ )
涂威威大规模分布式机器学习系统设计与应用经验分享 8
机器学习在工业应用中的发展趋势
机器学习算法在工业应用中的四个象限
宏观特征 微观特征
复杂模型 复杂模型
宏观特征 微观特征
简单模型 简单模型
涂威威大规模分布式机器
您可能关注的文档
- 基于IEEE754标准的流量计表头设计-电子器件.PDF
- 基于Internet的分布式供能远程监控系统.PDF
- 基于Jaccard距离与概念聚类的多模型估计-计算机工程.PDF
- 基于Jitterbug的网络控制系统时延补偿的研究.PDF
- 基于MapReduce的高效用序列模式挖掘算法-计算机系统应用.PDF
- 基于MapReduce的混合连接算法.PDF
- 基于MCGS的分布式电梯监控系统的设计.DOC
- 基于micaps31的中小流域降水与水文精细化预报平台设计与开发.PDF
- 基于MPC与EKF算法的电动汽车状态估计与横向稳定性控制.PDF
- 基于P2P技术的电站监控系统分布式数据库-水利文献信息系统.PDF
- 职业技术学院2024级工业机器人技术(安装与维护)专业人才培养方案.docx
- 职业技术学院2024级应用化工技术专业人才培养方案.pdf
- 职业技术学院2024级软件技术(前端开发)专业人才培养方案.pdf
- 职业技术学院2024软件技术专业人才培养方案.docx
- 职业技术学院2024级信息安全技术应用(安全运维)专业人才培养方案.docx
- 职业技术学院2024级新能源汽车检测与维修技术(车辆鉴定与评估)专业人才培养方案.pdf
- 职业技术学院2024级石油炼制技术专业人才培养方案.pdf
- 职业技术学院2024级环境监测技术专业人才培养方案.docx
- 职业技术学院2024级汽车制造与试验技术专业人才培养方案.pdf
- 职业技术学院2024级信息安全技术应用专业人才培养方案.pdf
文档评论(0)