- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
全校Al公开课DeepSeek与未来AI创新
DeepSeek核心技术白话解读
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才王鹏
国家级人才
西北工业大学计算机学院
2025年2月26日
空天地海一体化大数据应用技术国家工程实验室
ationfrgneeingLabeatoryforthtegraedAero-5paceGruund-OweanBigDataAppkabonTechoclogy
全校Al公开课DeepSeek与未来AI创新
第一部分
引言
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才
报告主题:DeepSeek核心技术白话解读
全校Al公开课DeepSeek与未来AI创新
DeepSeek
DeepSeek的突破性定位
首个低成本、高性能的开源大语言模型
性能比肩GPT-4、OpenAl-01等顶尖闭源大模型,训练成本仅为后者的5%-10%
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才
DeepSeek-V3性能DeepSeek
DeepSeek-V3性能
报告主题:DeepSeek核心技术白话解读
全校Al公开课DeepSeek与未来AI创新
用标理
用标理
通对
DeepSeek的几个版本
DeepSeek有语言和推理模型,及模型对应的满血蒸馏等诸多版本
推deepseek
推
深索未至之填通用语言大模型,
深索未至之填
开加对酒对标ChatGPT
开加对酒
嘉宾:王鹏西北工业大学计算机学院教授
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才V我是DeepSeek,很高兴见到你!
国家级人才
先思考后回答,画65/9任
对标OpenAl-01i
*
DeepSeek完整的版本性能强大但计算开销大
模型不变,通过降低参数精度,提高推理效率
知识浓缩液大模型小模将大型模型的知识压缩到更小的模型中,性能稍
知识浓缩液
大模型
小模
全校Al公开课DeepSeek与未来Al创新
核心逻辑:用更少的成本做更多的事
功能实现终极目标更少的成本
功能实现
终极目标
更少的成本
更少的模型参数
学习策略
嘉宾:王鹏西北工业
嘉宾:王鹏
西北工业大学计算机学院教授
模型框架
更少的通讯开销
国家级人才
工程实现更少的数据标注
工程实现
全校Al公开课DeepSeek与未来Al创新
2.1学习策略创新:背景知识
机器学习模型:一种映射,在给定输入情况(x)下、输出一定结果的函数f(x)。
机器学习:根据反馈信号调整模型的参数,以使模型的表现符合预期
Xf(x)
输入模型输出
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才反馈信号
国家级人才
报告主题:DeepSeek核心技术白话解读
全校Al公开课DeepSeek与未来Al创新
2.1学习策略创新:背景知识
监督学习和强化学习是两种常见的机器学习策略
类比:
类比:老师手把手教你做题,直接告诉你解题思路
优势:学习目标明确,训练效率高,易收敛
劣势:依赖标注数据,泛化能力受限
嘉宾:王鹏
嘉宾:王鹏
西北工业大学计算机学院教授类比:只告诉你答案是否正确,不指导解题思路优势:无需标注数据,可处理开放性问题输入x
西北工业大学计算机学院教授
类比:只告诉你答案是否正确,不指导解题思路
优势:无需标注数据,可处理开放性问题
输入x模型
国家级人才
输出是否正确劣势:需大量试错,训练效率低,难收敛
输出是否正确
报告主题:DeepSeek核心技术白话解读
全校Al公开课DeepSeek与未来AI创新
在海监督2.1学习策略创新:背景知识
在海监督
大模型训练流程:预训练+后训练
预训练
在海量文本数据上进行下一词预测的(自)监督学习,用于学习足够多的语言知识
嘉宾:王鹏西北工业大学计算机学院教授
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才
国家级人才
LMs)
随机初始化海量数据预训练后的大模型
随机初始化
海量数据
监督微调,在少量带有思考过程(思维链)的监督数据上进行下一词预测学习,用于激发推理能力
思维连监督微调
?,
LLMs)预训练后的大模型微调后的大模型
LLMs)
预训练后的大模型
微调后的大模型
问题
嘉宾:王鹏
西北工业大学计算机学院教授
国家级人才
全校Al
文档评论(0)