DeepSeek完全实用手册V1.0+-+至顶AI实验室.pptx

下载文档

30
0
约1.22万字
约 115页
2025-03-02 发布于中国
举报
版权申诉
保障服务

DeepSeek完全实用手册V1.0+-+至顶AI实验室.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

DeepSeek完全实用手册V1.0+-+至顶AI实验室

DeepSeek完全实用手册

—从技术原理到使用技巧—;

一、DeepSeek是谁

二、DeepSeek技术路线解析

三、DeepSeek调用与部署

四、如何使用DeepSeek

结语趋势判断;;;;;

开源的优劣

与闭源模型的策略相比，将模型开源的策略可以获得更多开发者关注使用和共同开发，利于构建影响力和实现普惠。但难以获得商业利润。

闭源的优劣

将最先进的技术保密，有利于持续保有市场竞争力，实现商业化获利。但吸引开发者较少，且不利于社会整体技术进步。;;

OpenAI创始人SamAltman：DeepSeekR1是一个令人印象深刻的模型，尤其是能够以这样的价格提供卓越性能。我们(OpenAI)显然会推出更好的模型，同时，有一个新的竞争对手加入确实让人感到振奋！

微软CEOSatyaNadella：DeepSeek的新模型非常令人印象深刻，他们不仅有效地实现了一个开源模型，实现了推理时间计算，而且计算效率极高。

AI投资机构a16z创始人MarcAndreessen：DeepSeekR1是他所见过的最令人惊叹、最令人印象深刻的突破之一，是给世界的一份深刻礼物。

EurekaLabs创始人AndrejKarpathy：DeepSeekR1与OpenAI的模型在性能上旗鼓相当。

Perplexity创始人AravindSrinivas：DeepSeek是人工智能和开源的重大进步。人工智能模型和使用这些模型的产品需要最大限度地寻求真相。输出越虚假，使用这些模型或其输出(直接作为用户)和间接(用于提炼)就越危险。

NVIDIA资深研究经理JimFan：DeepSeek不仅开源了一系列模型，更难能可贵的是公开了所有训练细节。;

一、DeepSeek是谁

二、DeepSeek技术路线解析

三、DeepSeek调用与部署

四、如何使用DeepSeek

结语趋势判断;

基座模型V3

冷启动

CoT奖励

V3SFT数据

CoT提示

推理数据非推理数据

组合数据SFT

SFT

强化学习

蒸馏模型R1模型;

a;;;

权重梯度

输入

权重

优化器状态;;

答：DeepSeekV3成本并非是550万美元。

DeepSeekV3技术报告明确指出，预训练、上下文延长、后训练等个训练过程共花费约558万美元。准确来说，除了公开的训练成;;

术语解读-CUDA

CUDA全称为计算统一设备架构，是一个专有的并行计算平台和应用程序编程接口。开发者使用CUDA接口，便于关注软件算法，无

需关注硬件本身每一步是如何具体运行的。

术语解读-PTX

PTX全称为并行线程执行，是Nvidia的CUDA编程环境中使用的低级并行线程执行虚拟机和指令集架构。PTX比CUDA更靠近硬件层。;

一、DeepSeek是谁

二、DeepSeek技术路线解析

三、DeepSeek调用与部署

四、如何使用DeepSeek

结语趋势判断;

?云端调用

?云端调用，可通过官方API或第三方API直接调用DeepSeekR1模型服务并接入业务中；或者可以在云平台上创建、部署、微调模型，再通过API连接模型调用。

?云端调用优势在于，用户无需购置硬件即可按需调用云端模型。;

?软件/应用

纳米搜索

秘塔AI搜索

文心一言

钉钉;

云平台

?偏向为企业级用户服务，各云平台服务类型丰富收费不一，以百度智能云为例，与DeepSeekR1相关的服务包括：平台预置服务调用、用户部署模型服务调用、模型精调、批量预测等。

?在百度智能云直接调用R1模型API，每百万token输入价格2元，输出价格8元。

?在阿里云直接调用R1模型API，每百万token输入价格4元，输出价格16元。;

-参数量为671b

-显存需求：16位满血版约1300G显存

-硬件建议：4台8卡昇腾910B服务器及以上，或2台英伟达H800服务器及以上;

模型;

-主机：DellPrecision5860塔式工作站

-硬件：【GPU】NVIDIARTX5000AdaX2(64GVRAM)

您可能关注的文档

文档评论（0）

沧海一粟2020 + 关注: 实名认证

内容提供者

文不能提笔控萝莉，武不能骑马战人妻，入佛门则六根不净，入商道则狼性不足，想想还是做文字民工！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

DeepSeek完全实用手册V1.0+-+至顶AI实验室.pptx