- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
LLaMA-Factory快速上手教程
1.项目背景
开源大模型如LLaMA,Qwen,Baichuan等主要都是使用通用数据进行训练而来,其对于不同下游的使用场景和垂直领域的效果有待进一步提升,衍生出了微调训练相关的需求,包含预训练(pt),指令微调(sft),基于人工反馈的对齐(rlhf)等全链路。但大模型训练对于显存和算力的要求较高,同时也需要下游开发者对大模型本身的技术有一定了解,具有一定的门槛。
LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术,适配市场主流开源模型,形成一个功能丰富,适配性好的训练框架。项目提供了多个高层次抽象的调用接口,包含多阶段训练,推理测试,benchmark评测,APIServer等,使开发者开箱即用。同时借鉴StableDiffsionWebUI相关,本项目提供了基于gradio的网页版工作台,方便初学者可以迅速上手操作,开发出自己的第一个模型。
2.本教程目标
以Meta-Llama-3-8B-Instruct模型和Linux+RTX409024GB环境,LoRA+sft训练阶段为例子,帮助开发者迅速浏览和实践本项目会涉及到的常见若干个功能,包括
原始模型直接推理
自定义数据集构建
基于LoRA的sft指令微调
动态合并LoRA的推理
批量预测和训练效果评估
LoRA模型合并导出
一站式webuiboard的使用
APIServer的启动与调用
大模型主流评测benchmark
导出GGUF格式,使用Ollama推理
本教程大部分内容都可以通过LLaMA-Factory下的?README.md,data/README.md,examples文件夹下的示例脚本得到,遇到问题请先阅读项目原始相关资料。
关于全参训练,flash-attention加速,deepspeed,rlhf,多模态模型训练等更高阶feature的使用,后续会有额外的教程来介绍
3.?前置准备
训练顺利运行需要包含4个必备条件
机器本身的硬件和驱动支持(包含显卡驱动,网络环境等)
本项目及相关依赖的python库的正确安装(包含CUDA,Pytorch等)
目标训练模型文件的正确下载
训练数据集的正确构造和配置
3.1硬件环境校验
显卡驱动和CUDA的安装,网络教程很多,不在本教程范围以内
使用以下命令做最简单的校验
nvidia-smi
预期输出如图,显示GPU当前状态和配置信息
那多大的模型用什么训练方式需要多大的GPU呢,可参考?/hiyouga/LLaMA-Factory?tab=readme-ov-file#hardware-requirement
新手建议是3090和4090起步,可以比较容易地训练比较主流的入门级别大模型7B和8B版本。
3.2CUDA和Pytorch环境校验
请参考项目的readme进行安装
/hiyouga/LLaMA-Factory?tab=readme-ov-file#dependence-installation
2024年51期间系统版本有较大升级,2024-06-07号的安装版本命令如下,请注意conda环境的激活。
gitclone/hiyouga/LLaMA-Factory.git
下载miniconda
mkdir-p~/miniconda3
wget/miniconda/Miniconda3-latest-Linux-x86_64.sh-O~/miniconda3/miniconda.sh
bash~/miniconda3/miniconda.sh-b-u-p~/miniconda3
rm-rf~/miniconda3/miniconda.sh
~/miniconda3/bin/condainitbash
condacreate-nllama_factorypython=3.10
condaactivatellama_factory
cdLLaMA-Factory
pipinstall-e.[torch,metrics]-i/simple
上述的安装命令完成了如下几件事
新建一个LLaMA-Factory使用的python环境(可选)
安装LLaMA-Factory所需要的第三方基础库(requirements.txt包含的库)
安装评估指标所需要的库,包含nltk,jieba,rouge-chinese
安装LLaMA-Factory本身,然后在系统中生成一个命令llamafactory-cli(具体用法见下方教程)
安装后使用以下命令做简单的正确性校验
校验1
importtorch
您可能关注的文档
- 自然语言处理介绍和构建时序特征学习笔记.pdf
- 自然语言处理循环神经⽹络学习笔记.pdf
- 自然语言处理之Seq2Seq原理简介.pdf
- 自然语言处理Seq2Seq和Transformer原理实现学习笔记.pdf
- 自然语言处理之Transformer翻译项⽬源码解析.pdf
- 自然语言处理⾃注意⼒机制的计算⽅法以及多头注意⼒的作⽤和类⽐学习笔记.pdf
- 自然语言处理之⼤模型架构介绍.pdf
- 自然语言处理BERT和GLM原理介绍.pdf
- 自然语言处理之生成式大模型介绍.pdf
- 自然语言处理之本地⼤模型使⽤和⼤模型微调流程学习笔记.pdf
- 提升执行力与公信力对策研究.pdf
- 2025 初中语文八年级上册《背影》四次背影描写课件.pptx
- 离婚协议书范本.docx
- 2025年甘肃省武威市凉州区金沙镇人民政府招聘专业化管理大学生村文书备考题库及答案详解(网校专用).docx
- 2025 初中语文八年级上册《蝉》科学小品文特点课件.pptx
- 2025年甘肃省武威市凉州区金沙镇人民政府招聘专业化管理大学生村文书备考题库及答案详解(考点梳理).docx
- 2025至2030尿素硝酸铵(UAN)行业细分市场及应用领域与趋势展望研究报告.docx
- 护理课件:重症监护技术.pptx
- 2025至2030金属包装材料市场市场占有率及有效策略与实施路径评估报告.docx
- 2025年甘肃省武威市凉州区金沙镇人民政府招聘专业化管理大学生村文书备考题库及答案详解(真题汇编).docx
最近下载
- 船用UG-25+调速器安装调试手册.pdf
- 城市残疾人居家托养服务项目效果评估:多维度分析与优化策略.docx
- 石家庄市网约车认证理论统考题库(含答案).docx VIP
- 高速公路隧道消防系统养护制度与管理方案 .pdf VIP
- 高频精选:曲师大考研西方音乐史真题及答案.doc VIP
- 智能穿戴设备在武术运动中的运动数据分析报告.docx
- Leadshine雷赛CL3C-EC808AC经济型EtherCAT总线闭环步进驱动器用户手册.pdf
- 220kv架空线路设计.doc VIP
- CSC5113_V13926596180三节锂电池保护芯片.pdf VIP
- 自主导航无人设备的施工安全智能预警系统开发.docx VIP
原创力文档


文档评论(0)