DeepSeek核心技术白话解读PPT.docxVIP

下载本文档

1
0
约1.08万字
约 36页
2025-04-08 发布于北京
举报
版权申诉

DeepSeek核心技术白话解读PPT.docx

1、本文档共36页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

全校Al公开课DeepSeek与未来AI创新

DeepSeek核心技术白话解读

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才王鹏

国家级人才

西北工业大学计算机学院

2025年2月26日

空天地海一体化大数据应用技术国家工程实验室

ationfrgneeingLabeatoryforthtegraedAero-5paceGruund-OweanBigDataAppkabonTechoclogy

全校Al公开课DeepSeek与未来AI创新

第一部分

引言

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才

报告主题：DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来AI创新

DeepSeek

DeepSeek的突破性定位

首个低成本、高性能的开源大语言模型

性能比肩GPT-4、OpenAl-01等顶尖闭源大模型，训练成本仅为后者的5%-10%

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才

DeepSeek-V3性能DeepSeek

DeepSeek-V3性能

报告主题：DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来AI创新

用标理

通对

DeepSeek的几个版本

DeepSeek有语言和推理模型，及模型对应的满血蒸馏等诸多版本

推deepseek

推

深索未至之填通用语言大模型，

深索未至之填

开加对酒对标ChatGPT

开加对酒

嘉宾：王鹏西北工业大学计算机学院教授

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才V我是DeepSeek,很高兴见到你!

国家级人才

先思考后回答，画65/9任

对标OpenAl-01i

DeepSeek完整的版本性能强大但计算开销大

模型不变，通过降低参数精度，提高推理效率

知识浓缩液大模型小模将大型模型的知识压缩到更小的模型中，性能稍

知识浓缩液

大模型

小模

全校Al公开课DeepSeek与未来Al创新

核心逻辑：用更少的成本做更多的事

功能实现终极目标更少的成本

功能实现

终极目标

更少的成本

更少的模型参数

学习策略

嘉宾：王鹏西北工业

嘉宾：王鹏

西北工业大学计算机学院教授

模型框架

更少的通讯开销

国家级人才

工程实现更少的数据标注

工程实现

全校Al公开课DeepSeek与未来Al创新

2.1学习策略创新：背景知识

机器学习模型：一种映射，在给定输入情况(x)下、输出一定结果的函数f(x)。

机器学习：根据反馈信号调整模型的参数，以使模型的表现符合预期

Xf(x)

输入模型输出

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才反馈信号

国家级人才

报告主题：DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来Al创新

2.1学习策略创新：背景知识

监督学习和强化学习是两种常见的机器学习策略

类比：

类比：老师手把手教你做题，直接告诉你解题思路

优势：学习目标明确，训练效率高，易收敛

劣势：依赖标注数据，泛化能力受限

嘉宾：王鹏

西北工业大学计算机学院教授类比：只告诉你答案是否正确，不指导解题思路优势：无需标注数据，可处理开放性问题输入x

西北工业大学计算机学院教授

类比：只告诉你答案是否正确，不指导解题思路

优势：无需标注数据，可处理开放性问题

输入x模型

国家级人才

输出是否正确劣势：需大量试错，训练效率低，难收敛

输出是否正确

报告主题：DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来AI创新

在海监督2.1学习策略创新：背景知识

在海监督

大模型训练流程：预训练+后训练

预训练

在海量文本数据上进行下一词预测的(自)监督学习，用于学习足够多的语言知识

嘉宾：王鹏西北工业大学计算机学院教授

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才

LMs)

随机初始化海量数据预训练后的大模型

随机初始化

海量数据

监督微调，在少量带有思考过程(思维链)的监督数据上进行下一词预测学习，用于激发推理能力

思维连监督微调

LLMs)预训练后的大模型微调后的大模型

LLMs)

预训练后的大模型

微调后的大模型

问题

嘉宾：王鹏

西北工业大学计算机学院教授

国家级人才

全校Al

您可能关注的文档

文档评论（0）

哈哈 + 关注: 实名认证

文档贡献者

嗨，朋友，我都会用最可爱的语言和最实用的内容，帮助你更好地理解和应对职场中的各种挑战！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

DeepSeek核心技术白话解读PPT.docxVIP