电商搜索和推荐场景下的MLOps实践.pdf

下载文档

0
0
约5.1千字
约 25页
2023-07-09 发布于广西
举报
版权申诉
保障服务

电商搜索和推荐场景下的MLOps实践.pdf

1、本文档共25页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

电商搜推场景下的MLOps实践 QCon 2023全球软件开发北京大会李友科京东-零售自我介绍李友科 • 京东零售 • 负责系统的风险控制、质量保障与效率提升 QCon 2023全球软件开发北京大会 • 在电商搜推场景下，测试服务化、算法服务化、MLOps平台化落地的核心参与者 “You Got a Dream, You Gotta Protect It” Scene From The Pursuit of Happyness 议程  概况  规模化后，成本、效率与质量  工程实践成就算法服务化 • 低负载治理 • 算法协作 • 模型双飞轮 • 团队协作 • 特征工程效率与质量QCon 2023全球软件开发北京大会 • 模型与特征  总结 • 算法服务化 • 模型评测  从算法服务化到MLOps平台化 • 工作界面改变 • 度量与平台自我迭代 • 平台系统架构 ML在需求交付流程中的位置大环境和趋势： • 互联网降本增效 • 技术部门，工作价值量化，成本效率为主电商行业： • 存量竞争 • 用户转化率、商家可运营、流量生态 • 搜推系统核心竞争力，预测服务质量和算法迭代 QCon 2023全球软件开发北京大会效率流量分发： • 模型从简单线性、树型模型到复杂的深度模型 • 业务效率持续提升 • 业务赋能、流量调控 • 快速应对业务需求 ML生命周期与MLOps QCon 2023全球软件开发北京大会模型双飞轮（一） • 正在AB实验的模型，迭代目标：效率提升、业务实验模型赋能、流量调控 • 通过AB实验挑选出，满足全量的模型。全量模型全量模型服务大部分流量，同时作为实验模型的对比基准 QCon 2023全球软件开发北京大会 • 对应上一个版本的全量模型,保留1-2周，对比观 Holdback模察全量模型的业务效果型模型双飞轮（二） QCon 2023全球软件开发北京大会特征工程的效率与质量（一） • 特征：Dump原始特征 • 效率：在线和离线并行开发算子，不需要等待算子上线，就可以开始离线模型开发和训练。可能需要花费大量时间对齐算后特征 • 质量：如果不能保障算子质量，在线和离线算后特征不一致风险极高 QCon 2023全球软件开发北京大会特征工程的效率与质量（二） • 特征：Dump算后特征 • 效率：离线训练需要等待在线算子开发、特征积累。模型开发前期等待在线Ready ，一般需要2-3周 • 质量：理论上，不存在算后特征一致性 QCon 2023全球软件开发北京大会特征工程的效率与质量（三） • 特征：Dump算前特征，共享算子 • 效率：在线和离线共享相同代码的算子；只需要算子开发完成，就可以开始离线模型开发和训练 •