- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
训练本地部署DeepSeek模型【仅供学习参考】
前置条件
完成ollama来本地部署deepseek的。
在c盘安装ollama
通过cmd终端运行ollamarundeepseek-r1:1.5b命令,安装deepseek大模型
模型文件安装在D:\ollama\models。
人工智能、AI、大数据方面的零基础,
只会javascript,或略懂一些php、python
准备一些.txt文件做为数据
目标:
想对deepseek-r1:1.5b进行训练
1.微调的准备工作
Step1:确认模型路径
我本人的模型文件安装在D:\ollama\models,
这是Ollama存放模型文件的目录
Step2:准备训练数据
做为读者的你也要准备一些.txt文件。
确保这些文件的内容是纯文本,每行可以是一个训练样本。
例如:
你好,我是小明。
今天天气真好。
你喜欢编程吗?
Step3:安装Python和相关工具
虽然你不会Python,但微调模型需要使用Python工具。
别担心,我会尽量简化步骤:
1.安装Python:
从Python官网下载并安装Python
安装时记得勾选“AddPythontoPATH”
2.安装依赖库:打开cmd终端,运行以下命令:
pipinstalltorchtransformersdatasets
这个的安装,非常缓慢
英文音标
torch:/tɔːrtʃ/
transformers:/trænsˈfɔːrmərz/
datasets:/ˈdeɪtəˌsɛts/
这三个Python库:
torch、transformers和datasets
它们是机器学习(特别是深度学习)和自然语言处理(NLP)领域常用的工具库
torch
是PyTorch的核心库,是一个开源的深度学习框架。它提供了用于构建、训练和部署深度学习模
型的工具和接口。
transformers
是HuggingFace提供的一个开源库,专注于自然语言处理(NLP)任务的预训练模型和工具
datasets
也是HuggingFace提供的一个开源库,用于管理和加载各种机器学习任务中的数据集(尤其是
NLP数据集)
这三个库的结合通常用于以下场景:
使用datasets加载数据。
使用transformers加载和微调预训练的NLP模型。
使用torch搭建和训练深度学习模型。
它们是NLP和深度学习领域开发者的主要工具链之一
安装过程中:
红框处显示:当前下载进度和预计剩余时间
9.2/204.1MB:表示当前已经下载了9.2MB,总共需要下载204.1MB
22.2KB/s:表示当前下载速度是每秒22.2KB
eta2:41:12:表示预计还需要2小时41分钟12秒才能完成下载
eta是EstimatedTimeofArrival的缩写,即预计完成时间
安装成功提示如下:
-上面是,安装了哪些东西-下面是,成功安装了哪些
piplist命令
piplist命令用于列出所有已安装的Python包及其版本号
查看列表中,是否有torch、transformers和datasets
2.加载预训练模型和分词器
2.1选择编辑器
推荐使用以下编辑器:
VSCode:功能强大,支持Python开发。
PyCharm:专门为Python设计的IDE。
JupyterNotebook:适合初学者,交互式操作。
记事本/文本编辑器:最基础的编辑器。
这里以VSCode为例。
2.2新建工作目录
1.在D:\ollama\目录下新建一个文件夹fine_tune_deepseek,用于存放所有
您可能关注的文档
最近下载
- 国家二级C语言机试(选择题)模拟试卷11(共313题).pdf
- 【国家标准】DB34T 5012-2015 安徽省回弹法检测泵送混凝土强度技术规程.pdf
- 毕业设计(论文)-睡眠呼吸暂停报警监护仪的设计.doc
- 工人商调登记表.doc
- 南宋广西买马路对广西与大理两地关系的影响.pdf VIP
- 推进云南农业新质生产力发展的对策分析.docx VIP
- (高清版)DB52∕T 1222-2017 地理标志产品 习水红稗.pdf VIP
- 净化空调工程安装施工方案.pdf VIP
- 第47届世界技能大赛江苏省选拔赛3D数字游戏艺术项目技术工作文件(1).pdf
- 经营性公路建设项目投资人招标文件.pdf VIP
文档评论(0)