- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Data与AI的融合演进
目录
01OneOps的理念与价值
02OneOps的实践场景
03WeData的OneOps实践
OneOps的理念与价
值
传统的数据平台在AI时代面临的挑战
数据开发和AI
数据开发和AI开发分离
?大数据和AI为两套独立系统,很难实现端到端的流程的样本清洗、存储、分析、训练、推理
存储、计算成本高
?数据需要在两套系统间来回流动
?大数据和AI的CPU、GPU算力无法复用
洞察:烟囱式架构造成成本和效率问题,一体化方案更有优势
面向数据工程+数据科学的OneOps方案
面向数据工程+数据科学的OneOps方案
一份数据、计算For数据分析和AI应用
更好的机器学习是80%的数据处理+20%的模型----吴恩达
OneOps可以解决什么问题
模型服务不可持续?
模型服务不可持续
?模型迭代并部署上线的速度无法及时响应业务需求的快速变更
?上线那一刻开始模型存在降级退化风险(数据漂移)
模型开发部署迭代周期长?Algorithmia
模型开发部署迭代
周期长
?Algorithmia2020:64%的企业部署一个新模型花费超过一个月的时间,其中18%的公司需要90天以上上线
AI工程化发展
工具
模型全生命周期缺乏统一管理
?代码、数据、算法、模型等资产缺乏统一的版本管理及可追溯能力
?企业在ML生产至应用过程中缺乏相应的规范
产品
产品
流程与协同
自动化程度较低
自动化程度较低
?存在较多手动流程,效率较低,人力成本大
?缺乏完善的监控和告警机制,无法在损害发生之前捕捉到错误,并及时修正
存在潜在风险?
存在潜在风险
?技术风险:不稳定的模型效果,脆弱的基础设施
?合规风险:违反政府监管规定和公司政策
跨团队协作困难
?不同团队的工具和工作流程差异大
?业务团队、运维团队和AI团队间的孤岛效应、沟通鸿沟无法逾越
OneOps如何推进:需要多角色共同参与
业务
负责人
数据
工程师
数据
科学家
研发
工程师
数据
管理员
--负责把控AI方案对于业务的价值
--构建数据工作流
--将业务问题转化为算法问题,训练、调优模型
--部署AI模型到生产环境
--负责保证数据管理和数据合规性
OneOps如何推进:各角色分别对不同环节负责
数据管理员
数据科学家数据
数据科学家
工程师
研发工程师
业务负责人
0
数据准备
132456
1
3
2
4
数据探索特征工程模型训练模型验证部署应用质量监控
OneOps的实践要点
版本管理评估与测试OneOps实践要点
版本管理
评估与测试
OneOps实践要点
数据/代码/配置/模型/超参数/流水线端到端集成测试,并支持非功能需求测试(安全性/公平性等)
数据/代码/配置/
模型/超参数/流水线
端到端集成测试,并支持非功能需求测试(安全性/公平性等)
2.以数据为中心,来实现AI的研发
3.以模块化平台的方式实现全生命周期的驱动:如数据探索,特征工程,模型训练,模型服务等
4.使用自动化流程实现持续训练、持续集成、持续交付
自动化可重现协同部署监控与迭代
自动化
可重现
协同部署
全流程高度自动化,如CI/CD/CT等特征库一致性/支持
全流程高度自动化,如CI/CD/CT等
特征库一致性/支持端边云部署
数据漂移/模型指标等监控
OneOps实践场景
金融行业--贷款申请场景
贷款申请是金融行业中的一个典型场景,我们将逐环节解释不同角色如何配合推进OneOps流程。
数据管理员
数据科学家数据
数据科学家
工程师
研发工程师
业务负责人
0
数据准备
132456
1
3
2
4
数据探索特征工程模型训练模型验证部署应用质量监控
金融行业--贷款申请审核场景
业务决策工作流
希望实现贷款自动化审核业务负责人收到汇报,营业部反馈:“贷款申请数量庞大,审核责任重大而且工作量非常繁重,希望能够利用AI提升效率和审核准确性”。
希望实现贷款自动化审核
为提升经营效率,业务负责人决
您可能关注的文档
- 大模型技术及行业应用介绍-腾讯云.docx
- 打造好用的AI助力气象产业高质量发展.docx
- 传媒专属精调模型建设.docx
- XX智能座舱体验新升级——让用车更愉悦.docx
- XX智能汽车云:加速智能驾驶进化.docx
- XX云智能体开发平台技术创新分享-加速企业Agent应用落地.docx
- XX智慧能源×人工智能.docx
- 产品面对面——智能体开发平台入门与基础实操.docx
- XX云大模型知识引擎「快、易、省」的搭建DeepSeek企业级应用.docx
- XX云TI平台的大模型精调解决方案.docx
- 2025国家税务总局阿坝州税务局考调工作人员9人行测备考题库附答案.docx
- 2026中国光大银行北京分行秋季校园招聘备考题库附答案.docx
- 2025贵州安顺市市直机关面向全市遴选公务员50人行测备考题库附答案.docx
- 2025湖北浠水国创投资有限公司招聘15人模拟试卷附答案解析.docx
- 2026内蒙古气象部门招聘97名应届高校毕业生(气象类-第一批)备考题库附答案解析.docx
- 2026年中国邮政储蓄银行泰安分行校园招聘备考题库附答案解析.docx
- 2025重庆公路运输(集团)有限公司招聘55人考前自测高频考点模拟试题附答案解析.docx
- 2026年云南省思茅市单招职业适应性测试题库推荐.docx
- 备考2023年黑龙江省大兴安岭地区警察招考公安专业科目真题(含答案).pdf
- 2025江苏镇江市卫生健康委员会所属镇江市中西医结合医院遴选事业单位人员1人备考题库附答案解析.docx
最近下载
- 25秋国家开放大学《人文英语1》形考任务参考答案.docx
- 《小学家长进课堂》.pptx VIP
- 轮椅智能折叠机构设计与分析.doc VIP
- 考研真题 清华大学903生化分子和细胞生物学综合历年考研真题汇编(含部分答案).docx VIP
- [PPT]各类型桥梁各部位名称图解_136页_讲解详细_权威资料.pptx VIP
- 2025年全球咖啡产业链绿色可持续发展分析与市场趋势报告.docx
- 食品质量安全风险日管控、周排查、月调度检查记录表.docx VIP
- 人力资源招聘流程与面试评估模板人才选拔指南.doc VIP
- 《The Boxcar Children》棚车少年第1部.pdf VIP
- 2022年中国汉字听写大会汉字听写知识竞赛题库及答案(共十三套).pdf VIP
原创力文档


文档评论(0)