- 0
- 0
- 约8.49千字
- 约 35页
- 2026-03-23 发布于浙江
- 举报
GenAI时代,从容应对数据驱动的AI带来的I/O挑战
GenAI时代,
从容应对数据驱动的AI带来的I/O挑战
演讲人:汤文军
Alluxio资深架构师
AI所带来的的IO挑战01IO挑战的解决思路——Alluxio介绍目录02Alluxio技术架构
AI所带来的的IO挑战
01
IO挑战的解决思路——Alluxio介绍
目录
02
Alluxio技术架构
03
典型应用场景
04
0
LLM性能受算力、数据规模和参数驱动=I/O变得至关重要Sc
LLM性能受算力、数据规模和参数驱动=I/O变得至关重要
ScalingLaw:大语言模型(LLM)训练的性能受到训练过程中不断增长的token数量、模型检查点(checkpoint)大小的驱动。
*来源:OpenAI:ScalingLawsforNeuralLanguageModels:/pdf/2001.08361.pdf
Token呈指数级增长=访问数据集需要更快的I/OLLM
Token呈指数级增长=访问数据集需要更快的I/O
LLM训练需要大量数据(数十亿至15万亿token)。
随着模型扩容,需要更快、更高效的I/O来应对数据集的快速增长。
?
?
*图:人工生成公共文本的有效存量以及用于知名大语言模型训练的数据集规模的预测
来源:Willwerunoutofdata?Limi
您可能关注的文档
- 思略特:“满川风雨看潮生”2030年中国汽车行业趋势展望.docx
- 思码逸中国信通院DevData2024研发效能基准报告46页.docx
- 苏震巍-协同研发的流程重塑使用AgentManager打造多智能体Copilot.docx
- 隋吉智-大规模、多云主机统一可观测实践.docx
- 泰伯智库自动驾驶数据闭环与数据合规白皮书202454页.docx
- 谭杰轩-AI大数据打造新一代数据开发治理一体化平台.docx
- 探索AmazonBedrock热门用例中的文本生成基础模型FoundationModel.docx
- 探索全新AmazonGraviton4处理器与应用.docx
- 淘天集团-涂靖-商品图降本1000倍的实践:淘天AI赋能商家经营之路.docx
- 腾讯-零信任安全解决方案-DLP.docx
原创力文档

文档评论(0)