Data与AI的融合演进.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Data与AI的融合演进

目录

01OneOps的理念与价值

02OneOps的实践场景

03WeData的OneOps实践

OneOps的理念与价

传统的数据平台在AI时代面临的挑战

数据开发和AI

数据开发和AI开发分离

?大数据和AI为两套独立系统,很难实现端到端的流程的样本清洗、存储、分析、训练、推理

存储、计算成本高

?数据需要在两套系统间来回流动

?大数据和AI的CPU、GPU算力无法复用

洞察:烟囱式架构造成成本和效率问题,一体化方案更有优势

面向数据工程+数据科学的OneOps方案

面向数据工程+数据科学的OneOps方案

一份数据、计算For数据分析和AI应用

更好的机器学习是80%的数据处理+20%的模型----吴恩达

OneOps可以解决什么问题

模型服务不可持续?

模型服务不可持续

?模型迭代并部署上线的速度无法及时响应业务需求的快速变更

?上线那一刻开始模型存在降级退化风险(数据漂移)

模型开发部署迭代周期长?Algorithmia

模型开发部署迭代

周期长

?Algorithmia2020:64%的企业部署一个新模型花费超过一个月的时间,其中18%的公司需要90天以上上线

AI工程化发展

工具

模型全生命周期缺乏统一管理

?代码、数据、算法、模型等资产缺乏统一的版本管理及可追溯能力

?企业在ML生产至应用过程中缺乏相应的规范

产品

产品

流程与协同

自动化程度较低

自动化程度较低

?存在较多手动流程,效率较低,人力成本大

?缺乏完善的监控和告警机制,无法在损害发生之前捕捉到错误,并及时修正

存在潜在风险?

存在潜在风险

?技术风险:不稳定的模型效果,脆弱的基础设施

?合规风险:违反政府监管规定和公司政策

跨团队协作困难

?不同团队的工具和工作流程差异大

?业务团队、运维团队和AI团队间的孤岛效应、沟通鸿沟无法逾越

OneOps如何推进:需要多角色共同参与

业务

负责人

数据

工程师

数据

科学家

研发

工程师

数据

管理员

--负责把控AI方案对于业务的价值

--构建数据工作流

--将业务问题转化为算法问题,训练、调优模型

--部署AI模型到生产环境

--负责保证数据管理和数据合规性

OneOps如何推进:各角色分别对不同环节负责

数据管理员

数据科学家数据

数据科学家

工程师

研发工程师

业务负责人

0

数据准备

132456

1

3

2

4

数据探索特征工程模型训练模型验证部署应用质量监控

OneOps的实践要点

版本管理评估与测试OneOps实践要点

版本管理

评估与测试

OneOps实践要点

数据/代码/配置/模型/超参数/流水线端到端集成测试,并支持非功能需求测试(安全性/公平性等)

数据/代码/配置/

模型/超参数/流水线

端到端集成测试,并支持非功能需求测试(安全性/公平性等)

2.以数据为中心,来实现AI的研发

3.以模块化平台的方式实现全生命周期的驱动:如数据探索,特征工程,模型训练,模型服务等

4.使用自动化流程实现持续训练、持续集成、持续交付

自动化可重现协同部署监控与迭代

自动化

可重现

协同部署

全流程高度自动化,如CI/CD/CT等特征库一致性/支持

全流程高度自动化,如CI/CD/CT等

特征库一致性/支持端边云部署

数据漂移/模型指标等监控

OneOps实践场景

金融行业--贷款申请场景

贷款申请是金融行业中的一个典型场景,我们将逐环节解释不同角色如何配合推进OneOps流程。

数据管理员

数据科学家数据

数据科学家

工程师

研发工程师

业务负责人

0

数据准备

132456

1

3

2

4

数据探索特征工程模型训练模型验证部署应用质量监控

金融行业--贷款申请审核场景

业务决策工作流

希望实现贷款自动化审核业务负责人收到汇报,营业部反馈:“贷款申请数量庞大,审核责任重大而且工作量非常繁重,希望能够利用AI提升效率和审核准确性”。

希望实现贷款自动化审核

为提升经营效率,业务负责人决

您可能关注的文档

文档评论(0)

情报猿 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档