网站大量收购独家精品文档,联系QQ:2885784924

DeepSeek核心技术白话解读PPT.docxVIP

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

全校Al公开课DeepSeek与未来AI创新

DeepSeek核心技术白话解读

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才王鹏

国家级人才

西北工业大学计算机学院

2025年2月26日

空天地海一体化大数据应用技术国家工程实验室

ationfrgneeingLabeatoryforthtegraedAero-5paceGruund-OweanBigDataAppkabonTechoclogy

全校Al公开课DeepSeek与未来AI创新

第一部分

引言

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才

报告主题:DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来AI创新

DeepSeek

DeepSeek的突破性定位

首个低成本、高性能的开源大语言模型

性能比肩GPT-4、OpenAl-01等顶尖闭源大模型,训练成本仅为后者的5%-10%

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才

DeepSeek-V3性能DeepSeek

DeepSeek-V3性能

报告主题:DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来AI创新

用标理

用标理

通对

DeepSeek的几个版本

DeepSeek有语言和推理模型,及模型对应的满血蒸馏等诸多版本

推deepseek

深索未至之填通用语言大模型,

深索未至之填

开加对酒对标ChatGPT

开加对酒

嘉宾:王鹏西北工业大学计算机学院教授

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才V我是DeepSeek,很高兴见到你!

国家级人才

先思考后回答,画65/9任

对标OpenAl-01i

*

DeepSeek完整的版本性能强大但计算开销大

模型不变,通过降低参数精度,提高推理效率

知识浓缩液大模型小模将大型模型的知识压缩到更小的模型中,性能稍

知识浓缩液

大模型

小模

全校Al公开课DeepSeek与未来Al创新

核心逻辑:用更少的成本做更多的事

功能实现终极目标更少的成本

功能实现

终极目标

更少的成本

更少的模型参数

学习策略

嘉宾:王鹏西北工业

嘉宾:王鹏

西北工业大学计算机学院教授

模型框架

更少的通讯开销

国家级人才

工程实现更少的数据标注

工程实现

全校Al公开课DeepSeek与未来Al创新

2.1学习策略创新:背景知识

机器学习模型:一种映射,在给定输入情况(x)下、输出一定结果的函数f(x)。

机器学习:根据反馈信号调整模型的参数,以使模型的表现符合预期

Xf(x)

输入模型输出

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才反馈信号

国家级人才

报告主题:DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来Al创新

2.1学习策略创新:背景知识

监督学习和强化学习是两种常见的机器学习策略

类比:

类比:老师手把手教你做题,直接告诉你解题思路

优势:学习目标明确,训练效率高,易收敛

劣势:依赖标注数据,泛化能力受限

嘉宾:王鹏

嘉宾:王鹏

西北工业大学计算机学院教授类比:只告诉你答案是否正确,不指导解题思路优势:无需标注数据,可处理开放性问题输入x

西北工业大学计算机学院教授

类比:只告诉你答案是否正确,不指导解题思路

优势:无需标注数据,可处理开放性问题

输入x模型

国家级人才

输出是否正确劣势:需大量试错,训练效率低,难收敛

输出是否正确

报告主题:DeepSeek核心技术白话解读

全校Al公开课DeepSeek与未来AI创新

在海监督2.1学习策略创新:背景知识

在海监督

大模型训练流程:预训练+后训练

预训练

在海量文本数据上进行下一词预测的(自)监督学习,用于学习足够多的语言知识

嘉宾:王鹏西北工业大学计算机学院教授

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才

国家级人才

LMs)

随机初始化海量数据预训练后的大模型

随机初始化

海量数据

监督微调,在少量带有思考过程(思维链)的监督数据上进行下一词预测学习,用于激发推理能力

思维连监督微调

?,

LLMs)预训练后的大模型微调后的大模型

LLMs)

预训练后的大模型

微调后的大模型

问题

嘉宾:王鹏

西北工业大学计算机学院教授

国家级人才

全校Al

文档评论(0)

哈哈 + 关注
实名认证
文档贡献者

嗨,朋友,我都会用最可爱的语言和最实用的内容,帮助你更好地理解和应对职场中的各种挑战!

1亿VIP精品文档

相关文档