网站大量收购独家精品文档,联系QQ:2885784924

2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告.pptxVIP

2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告.pptx

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年深度行业分析研究报告;

一、DeepSeek背景介绍

1.1、DeepSeek股权结构及创始人背景

1.2、DeepSeek母公司幻方量化,早期确立AI战略为后续出圈埋下伏笔

1.3、DeepSeek重视年轻团队且兼具深厚技术底蕴,薪酬对标字节跳动研发岗1.4、DeepSeek产品家族全梳理

1.5、DeepSeek日活远超同期ChatGPT,下载量霸榜全球140个市场移动应用榜首1.6、DeepSeek获得海内外市场认可,中国AI产业首次步入引领位置

二、DeepSeek模型家族技术详解

2.1、DeepSeek模型家族技术创新框架总揽

2.2、DeepSeekv3:性能对齐海外领军闭源模型,DeepSeek2024年巅峰之作

2.3、DeepSeekR1Zero核心创新点——RL(强化学习)替代SFT(有监督微调)2.4、DeepSeekR1:高质量冷启动数据+多阶段训练,将强推理能力泛化

2.5、开源大模型:打破OpenAI等闭源模型生态,提升世界对中国AI大模型认知;

一、DeepSeek背景介绍;

1.1、DeepSeek股权结构及创始人背景

DeepSeek是一家于2023年成立的中国初创企业,创始人是AI驱动量化对冲基金幻方量化的掌门人梁文锋。从股权结构图显示,DeepSeek由四名自然人通过五层控股掌握100%股份(其中梁文锋间接持股比例83.29%,直接持股1%,累计84.2945%)。

创始人梁文锋出生于广东湛江,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位,2008年起开始带领团队使用机器学习等技术探索全自动量化交易,2015年幻方量化正式成立。2021年,幻方量化的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年梁文锋宣布正式进军通用人工智能领域,创办DeepSeek,专注于做真正人类级别的人工智能。;

1.2、DeepSeek母公司幻方量化,早期确立AI战略为后续出圈埋下伏笔

母公司幻方量化确立以AI为发展方向。2016年,幻方量化第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用GPU进行计算。随后不久,该公司明确宣布AI为主要发展方向。

量化投资全面AI化驱动囤卡需求,为后续蜕变埋下伏笔。复杂的模型计算需求使得单机训练遭遇算力瓶颈,训练需求和有限的计算资源产生矛盾,幻方需要解决算力受限难题。于是幻方在2019年成立了一家AI基础研究公司,并推出自研的“萤火一号”AI集群,搭载500块显卡。2021年,幻方又斥资10亿元建设“萤火二号”,为AI研究提供算力支持。幻方在构建AI算力过程中的“囤卡”动作为它赢得了市场机会。作为国内早期的英伟达芯片大买家之一,2022年其用于科研支持的闲时算力高达1533万GPU时,大大超越了后来很多大模型公司。;

图:DeepSeek公开招聘职位信息汇总;

模型类别日期名称内容对标;

DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

在具体的测试集上,DeepSeek-V3在知识类任务上接近当前表现最好的模型Claude-3.5-Sonnet-1022;长文本/代码/数学/中文能力上均处于世界一流模型位置。;

1.4.2、DeepSeek-R1性能对标OpenAIo1正式版,实现发布即上线

DeepSeek-R1性能比较OpenAI-o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。DeepSeekR1同步登录

文档评论(0)

策划大师 + 关注
实名认证
文档贡献者

资深营销策划人,20年从业经验,服务过众多大型企业,广受赞誉。

1亿VIP精品文档

相关文档