- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
演讲人:琚克俭
01AI带来的数据湖变革
02Daft多模计算定位
03Daft核心场景
04Daft+Lance数据湖新范式
05Daft大规模数据处理实践
06未来展望
01
AI带来的数据湖变革
➢ChatBI/Agent/智驾/基模/具身/...
➢Database-Dataset
➢Table/View-Volume/Model/Function
➢
➢
➢
➢
➢
大模型发展迅速,数据处理领域快速从纯文本场景扩展到了文本、图片以及音视频等联合的多模态场景,
多模态数据管理相比原有的仅文本处理也有了新的技术挑战。
02
Daft多模计算定位
单机与分布式统一
多模与结构化统一
CPU与GPU异构统一
DaftFrame与SQL统一
预处理+推理+训练统一
✓
✓
✓
✓
框架概览
03
Daft核心场景
CPU+GPU异构
基于Ray的流式计算
少参数并发控制
Iterator数据输出
图文混排示例
⚫⚫⚫⚫
⚫
⚫
⚫
⚫⚫
自定义binary文件文本+图片+音视频Embedding/TensorArrow扩展类型
LLM推理
无限扩展预处理集群,
打破gpu训练机型的限制
Daft作为内存缓冲器,预
处理数据从S3/PFS上预加
载到内存中
TrainResume.练中断按照
Daft保存的Step状态处恢复
Rust减少GIL锁问题
04
Daft+Lance数据湖新范式
Zero-Cost
大小列统一存储DataEvolution
高性能随机点查透明编码
?图片/视频是存S3文件还是存lance列
✓
✓
Url延迟Download文件与结构化列统一存储
多模对象的KV方式访问
✓
✓
✓
✓
✓
✓
✓
AI领域的湖计算和湖存储
05
Daft大规模数据处理实践
客户原先架构
车端数据采集数据预处理+推理标注数据挖掘管理
您可能关注的文档
- Agent开发挑战:如何在敏捷与可靠之间做到既要、又要、还要?.pdf
- AICon深圳2025-纷享销客AIAgent平台落地实践.pdf
- CodeArts Doer 全流程多 Agent 协同,驱动研发全流程效能跃升.pdf
- Plaud 如何用软硬结合重构大模型时代的产品形态与商业路径.pdf
- 边雪冬-AIOps 驱动下的 TME 腾讯音乐智能运维新范式.pdf
- 从制造业看大模型在企业如何落地吴云.pdf
- 当AI Agent成为营销新引擎 破解流量困局与ROI迷局-0823.pdf
- 董纪伟-智能体驱动信贷风险的动态感知到策略自迭代.pdf
- 段然-AI 眼镜在线下社交场景中的多模态智能感知与主动交互.pdf
- 冯绪-TRAE 在 Agent 代码编辑的实践.pdf
最近下载
- XP-1A SF6定性检漏仪说明书.pdf VIP
- 《贝聿铭建筑设计》课件.ppt VIP
- 河北大学2024-2025学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- 2023年西南大学软件工程专业《计算机组成原理》科目期末试卷B(有答案).docx VIP
- 《3~6岁智力残疾儿童康复训练及支持性服务规范》.pdf VIP
- 河北大学2021-2022学年第1学期《高等数学(上)》期末考试试卷(A卷)及标准答案.pdf
- 河北科技大学2021-2022学年第1学期《高等数学(上)》期末考试试卷(B卷)及标准答案.pdf
- 光电探测器仿真:多物理场耦合仿真_(10).多物理场仿真软件介绍.docx VIP
- 数学三下 应用题.ppt VIP
- 河北大学2021-2022学年第1学期《高等数学(上)》期末考试试卷(B卷)及标准答案.pdf
原创力文档


文档评论(0)