- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek自学手册
从理论(模型训练)到实践(模型应用)
03
DeepseekR1四大使用技巧
06
Deepseek替代方案(在线本地部署)
02
DeepseekR1后
提示词的变与不变
05
Deepseek
实际应用场景
01
Deepseekv3和R1是怎么训练出来的
04
13个Deepseek
官方提示词样例
注:当前手册的信息更新截至2025年2月10日
目录
Contents
Deepseekv3是什么?
DeepSeekV3是一个强大的MoE语言模型(非推理型模
型)。它在数学、代码等任务上吊打其它开源模型,甚至能和闭源大佬GPT-4o、Claude-3.5-sonnet掰手腕,但训练花的钱还不到600万美元。
注:MoE,全称是Mixture-of-Expe比s,翻译成中文就是“混合专家”。你可以把它想象成一个团队,这个团队里有很多专家,每个专家都有自己的专长。当遇到一个问题时,不是所有专家都一起上,而是根据问题的类型,选择最合适的几个专家来解决。这样不仅提高了效率,还提升了性能。
初识Deepseekv3
数据、图表源自:DeepSeek-V3TechnicalRepo比
无额外损耗的负载均衡
前面DeepSeekMoE中提到的多项创新,其中就包括V3才推出的无额外损耗的负载均衡。
简单来说,在训练过程中,DeepSeekMoE
会监控每个专家的“工作量”,进而动态调整专家使用频率,避免某些专家过劳或”躺平。
Multi-HeadLatentAttention(MLA)
V3基础架构之一,在DeepSeekV2已经验证
有效,
MLA翻译成中文就是多头潜在注意力,传统模型推理时需缓存大量数据,MLA通过压缩键值对(类似精简笔记)减少内存占用,可以让模型在处理长文本时更高效。
DeepseekMOE
V3基础架构之一,同样在DeepSeekV2已经
验证有效。
DeepSeekMoE在传统MoE的基础上进行了多项创新和优化,比如更精细的专家分
工、共享专家等,适配复杂任务,进而提升模型的性能和计算效率。
多Token预测(MTP)策略
V3架构创新之一。
传统模型一次预测1个词,DeepSeekV3同时预测多个词(类似预判下一步),捉升数据利用效率,还能加速生成
Deepseekv3架构
Deepseekv3训练步骤和数据使用
无标注数据集预训练大模型基础大模型通用精调模型
基于规则的奖励横型:对于可以通过明确规则进行判别的任务(例如数学题、编程题),采用基于规则的奖励模型
基于模型的奖励模型:对于难以通过规则进行判别的任务(例如开放式问答、创意写作),则采用基于模型的奖励模型
推理数据:对于数学、代码、逻辑推理等需要复杂推理过程的任务,V3采用了基于R1生成的高质量推理数据
非推理数据:对于创意写作、角色扮演、简单问答等非推理类任务,则用V2.5生成响应,并由人工标注和校验
训练数据:相比V2,V3提高了数学和编程样本的比例,同时扩展了除英语和中文之外的多语言覆盖范围
预训练
(无监督学习)
精调
(监督学习)
精调
(强化学习)
Menchmarka
·Shet
DeepSeek-V2Bse
|Qwen25728Bae
LLMA414258Base
DwepSnwkV3Bae
Ardieture
MoE
Dmse
Dmse
MoE
ActvatodParan
21B
728
4058
B
otalFPararn
2368
78
4358
6715
English
Pletesta
0606
068
0.542
0548
BBt
het
7
7
829
575
MMU
S-het
784
50
4
871
MMURedu
5ht
76
832
813
2
MMLU-os
5shet
51.4
583
528
644
DMP
3-hst
80.4
06
0
.0
ARC-Lay
25shot
54
4
5
ARCCwlleg
5so
922
5
953
953
HellSwg
10-ho
87.1
48
92
58
PKQAa
het
69
26
847
WincGrandepo
5-het
63
23
852
54.9
RACT-MSdle
S-hat
71
41
742
71
RACE办
5hat
56
503
8
513
TviQ
您可能关注的文档
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pdf
- DeepSeek培训课件-清华大学-DeepSeekJ用场景智能化应用白皮书.pdf
- DeepSeek培训课件-清华大学-DeepSeek+DeepResearch应用报告.pdf
- DeepSeek培训课件-清华大学DeepSeek+DeepResearch-让科研像聊天一样简单.pdf
- DeepSeek培训课件-开发实战篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件-技术解析篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件-行业应用篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件个人使用篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件-大模型在办公方向的实践与思考.pdf
- 2025年市总工会党组书记、市委组织部部长生活会“四个带头”个人对照检查发言材料2篇(含上年度整改+个人情况、个人事项+典型案例).docx
- 2025年部编版小学六年级下册《道德与法治》第四单元 让世界更美好第10课 我们爱和平教学课件.pptx
- 公司领导班子2025年围绕“四个带头”主题检视问题整改落实方案与组织生活会批评意见(20条)2篇文.docx
- 教育系统党组班子2025年对照“四个带头”含意识形态、以典型案例举一反三解析检视材料【2篇文】.docx
- 2025年国有企业领导班子、学校副校长生活会“四个带头”方面对照个人检视发言材料2篇文(附:上年度整改情况、典型案例解析).docx
- 2025年生活会“四个带头”个人对照检查材料2篇文(含对其他领导批评意见,个人公开事项申报、意识形态).docx
- 2025年国有企业党委书记、领导班子生活会“四个带头”方面对照检查发言材料2篇文(上年度整改情况).docx
- 乡镇领导班子、市委组织部常务副部长2025年对照“四个带头”含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 市委社会工作部2025年生活会领导班子对照检视发言材料2篇文(含以案为鉴,深刻反思存在问题、反面典型案例举一反三解析、其他需要说明情况).docx
- 2025年民主生活会、组织生活会批评意见(20条)与市直单位领导班子“四个带头”对照检查材料【含上年度查摆问题整改落实情况】2篇文.docx
最近下载
- 海军概况(中国人民解放军海军指挥学院)网课期末测试答案(卷二).pdf
- 湖州市产业投资发展集团有限公司招聘笔试真题2023.docx VIP
- 城市轨道交通运营管理毕业论文-城市轨道交通行车组织模式分析.doc
- BIM建筑信息模型考试题及答案.docx VIP
- 丽声北极星自然拼读绘本第二级 Zeb's Web 课件.ppt
- 五态人格量表.pdf VIP
- 人教版高中地理选择性必修第2册 第四章 4.3 产业转移.ppt VIP
- 海尔21FV6H-B维修手册(30本家电维修电子书).pdf
- 口腔材料学-第二章(印模和石膏材料)1.pptx VIP
- 中小学校园食品安全与膳食经费管理专项整治工作自查报告22.docx VIP
文档评论(0)