DeepSeek内部研讨系列---DeepSeek原理和落地应用.pdfVIP

下载本文档

10
0
约2.29万字
约 56页
2025-05-21 发布于河南
举报
版权申诉

DeepSeek内部研讨系列---DeepSeek原理和落地应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

DeepSeek原理与落地应用

AI肖睿团队

（孙萍、吴寒、周嵘、李娜、张惠军、刘誉）

2025年03月01日

厦门大学大数据百家讲坛

•北大青鸟人工智能研究院

•北大计算机学院元宇宙技术研究所

•北大教育学院学习科学实验室

CONTENTS

人工智能概念辨析DeepSeekR1

大模型原理落地应用

PART01人工智能概念辨析

大模型相关术语

l多模态

Ø文本、图片、音频、视频

lAI工具（国内）

ØDeepSeek、豆包、Kimi、腾讯元宝、智谱清言、

通义千问、秘塔搜索、微信搜索...

l通用模型

Ø大语言模型（LLM，LargeLanguageModel）

Ø视觉模型（图片、视频）

Ø音频模型

Ø多模态模型

Ø……

l行业模型（垂直模型、垂类模型）

Ø教育、医疗、金融等

大模型的前世今生

•人工智能：让机器具备动物智能，人类智能，非人类智能（超人类智能）

•运算推理：规则核心；自动化

•知识工程：知识核心；知识库+推理机

•机器学习：学习核心；数据智能（统计学习方法，数据建模）

•常规机器学习方法：逻辑回归，决策森林，支持向量机，马尔科夫链，…..

•人工神经网络：与人脑最大的共同点是名字，机制和架构并不一样

•传统神经网络：霍普菲尔德网络，玻尔兹曼机，…..

•深度神经网络：深度学习

•传统网络架构：DBN，CNN，RNN，ResNet，Inception，……

•Transformer架构：可以并行矩阵计算（GPU），核心是注意力机制（Attention）

•编码器（BERT）：多数embedding模型，Ernie早期版本，…….

•混合网络：T5、GLM

•解码器（GPT）：大语言模型（LLM），也是传统的多模态模型的核心

•生成式人工智能（GenAI）：AIGC

•DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、……

•OpenAIGPT（ChatGPT）、Claude、Llama、Grok、……

•Diffusion架构：主要用于视觉模型（比如StableDiffusion、DALLE），现在也开始尝试用于语言模型

•Diffusion+Transformer架构：例如Sora的DiT（加入Diffusion的视觉模型），部分新的多模态模型架构

大模型的发展阶段

生成模型推理模型

ref中文大模型基准测评2024年度报告(2025.01.08)

生成模型与推理大模型的对比

比较项OpenAIGPT-4o（生成模型）OpenAIo1（推理模型）

您可能关注的文档

厦大林子雨-大模型概念、技术与应用实践——以DeepSeek为例.pdf

文档评论（0）

lcz0095 + 关注: 实名认证

文档贡献者

建筑设计工程师、建筑工程师持证人

本人从事工程类行业

咨询Ta 进入空间

领域认证该用户于2025年02月06日上传了建筑设计工程师、建筑工程师

1亿VIP精品文档

更多 >

DeepSeek内部研讨系列---DeepSeek原理和落地应用.pdfVIP