2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告.pptxVIP

下载本文档

0
0
约1.36万字
约 46页
2025-03-05 发布于陕西
举报
版权申诉

2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告.pptx

1、本文档共46页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2025年深度行业分析研究报告;

一、DeepSeek背景介绍

1.1、DeepSeek股权结构及创始人背景

1.2、DeepSeek母公司幻方量化，早期确立AI战略为后续出圈埋下伏笔

1.3、DeepSeek重视年轻团队且兼具深厚技术底蕴，薪酬对标字节跳动研发岗1.4、DeepSeek产品家族全梳理

1.5、DeepSeek日活远超同期ChatGPT，下载量霸榜全球140个市场移动应用榜首1.6、DeepSeek获得海内外市场认可，中国AI产业首次步入引领位置

二、DeepSeek模型家族技术详解

2.1、DeepSeek模型家族技术创新框架总揽

2.2、DeepSeekv3：性能对齐海外领军闭源模型，DeepSeek2024年巅峰之作

2.3、DeepSeekR1Zero核心创新点——RL（强化学习）替代SFT（有监督微调）2.4、DeepSeekR1：高质量冷启动数据+多阶段训练，将强推理能力泛化

2.5、开源大模型：打破OpenAI等闭源模型生态，提升世界对中国AI大模型认知;

一、DeepSeek背景介绍;

1.1、DeepSeek股权结构及创始人背景

DeepSeek是一家于2023年成立的中国初创企业，创始人是AI驱动量化对冲基金幻方量化的掌门人梁文锋。从股权结构图显示，DeepSeek由四名自然人通过五层控股掌握100%股份（其中梁文锋间接持股比例83.29%，直接持股1%，累计84.2945%）。

创始人梁文锋出生于广东湛江，浙江大学毕业，拥有信息与电子工程学系本科和硕士学位，2008年起开始带领团队使用机器学习等技术探索全自动量化交易，2015年幻方量化正式成立。2021年，幻方量化的资产管理规模突破千亿大关，跻身国内量化私募领域的“四大天王”之列。2023年梁文锋宣布正式进军通用人工智能领域，创办DeepSeek，专注于做真正人类级别的人工智能。;

1.2、DeepSeek母公司幻方量化，早期确立AI战略为后续出圈埋下伏笔

母公司幻方量化确立以AI为发展方向。2016年，幻方量化第一个由深度学习算法模型生成的股票仓位上线实盘交易，使用GPU进行计算。随后不久，该公司明确宣布AI为主要发展方向。

量化投资全面AI化驱动囤卡需求，为后续蜕变埋下伏笔。复杂的模型计算需求使得单机训练遭遇算力瓶颈，训练需求和有限的计算资源产生矛盾，幻方需要解决算力受限难题。于是幻方在2019年成立了一家AI基础研究公司，并推出自研的“萤火一号”AI集群，搭载500块显卡。2021年，幻方又斥资10亿元建设“萤火二号”，为AI研究提供算力支持。幻方在构建AI算力过程中的“囤卡”动作为它赢得了市场机会。作为国内早期的英伟达芯片大买家之一，2022年其用于科研支持的闲时算力高达1533万GPU时，大大超越了后来很多大模型公司。;

图：DeepSeek公开招聘职位信息汇总;

模型类别日期名称内容对标;

DeepSeek-V3为自研MoE模型，671B参数，激活37B，在14.8Ttoken上进行了预训练。V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

在具体的测试集上，DeepSeek-V3在知识类任务上接近当前表现最好的模型Claude-3.5-Sonnet-1022；长文本/代码/数学/中文能力上均处于世界一流模型位置。;

1.4.2、DeepSeek-R1性能对标OpenAIo1正式版，实现发布即上线

DeepSeek-R1性能比较OpenAI-o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAIo1正式版。DeepSeekR1同步登录

您可能关注的文档

文档评论（0）

策划大师 + 关注: 实名认证

文档贡献者

资深营销策划人，20年从业经验，服务过众多大型企业，广受赞誉。

咨询Ta 进入空间

1亿VIP精品文档

更多 >

2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告.pptxVIP