阿里云大数据AI一体化最佳实践.pptx

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;;;Data+AI典型开发生命周期;以数据为中心的模型开发;Data+AI项目成功关键点;案例1:离在线一体的智能推荐系统;案例2:知识库检索增强的大模型问答系统;Data+AI开发痛点:成本、效率、运维;Data+AI一体化;;大数据AI全景:从基础设施到应用服务;企业级Serverless智能数仓MaxCompute架构演进;Serverless云原生服务:成本、弹性、托管;数据平台Data+AI核心创新;;原生非结构化数据管理ObjectTable;分布式计算框架MaxFrame;MaxFrame核心能力;支持丰富算子库(数据分析、文本预处理);面向海量数据处理场景极致的性能提升;镜像管理:内置镜像+自定义镜像;实时数仓Holgores+向量引擎Proxima;Hologres丰富的向量计算场景;Hologres融合查询;数据分析从BI;DataWorksCopilot,数据开发智能提效;DataWorksAI增强分析:讲好数据故事;;LLM数据处理;LLM数据处理-文本去重

在LLM大模型的训练中,文本数据的去重起着至关重要的作用,通过文本去重可以大大提升模型训练的效率,通过MaxComputeMaxFrame可实现对原始数据大规模、并行处理,从而以更高的处理速度和更大的处理量完成大模型处理工作;LLM数据处理-自定义镜像构建;LLM数据处理-Python开发;自动分布式、并发处理;Data+AIPipeline调度;开发效率;大数据AI一体化;;;

文档评论(0)

优选文档 + 关注
实名认证
内容提供者

专注于发布优质文档,喜欢的可以关注一下哦~

1亿VIP精品文档

相关文档