- 0
- 0
- 约2.06万字
- 约 31页
- 2026-03-24 发布于浙江
- 举报
©2024,AmazonWebServices,Inc.或其附属公司。保留所有权利。
BOA402
开源大模型在亚马逊云科技上的
部署和微调优化实践
黄浩文
资深开发者布道师
亚马逊云科技
©2024,AmazonWebServices,Inc.或其附属公司。保留所有权利。
议程安排
1.大型语言模型(LLM)优化概述
•快速上手优化:AmazonBedrock和AmazonSageMakerJumpStart
•可用性优化:大型模型推理(LMI)容器
•吞吐量优化:RollingBatch/PagedAttention/FlashAttention/GQA
2.利用AmazonSageMaker部署开源大模型
•实践#1:在LMI中利用DeepSpeed部署Llama70B模型
3.利用AmazonSageMaker微调开源大模型
•实践#2:利用LoRA和FSDP微调Llama7B模型
您可能关注的文档
最近下载
- 山东省日照第一中学2025-2026学年高二上学期第一次质量检测 化学试卷(含答案).docx VIP
- GEA离心机训.PPT.ppt VIP
- 2026年天津市十二区重点学校高三下学期毕业班联考(一)物理试卷(无答案).docx VIP
- Behringer百灵达 X18 用户手册.pdf
- 枉法裁判控告书(实名控告法官).docx VIP
- 儿童过敏知识.ppt VIP
- 渔光互补项目技术方案.docx
- 基本农田划区定界图示.docx VIP
- 小额贷款5000急用不看征信(四篇).docx VIP
- 湖南省长沙市湖南师大附中2022-2023学年高二下学期第一次月考物理Word版含答案.docx VIP
原创力文档

文档评论(0)