(48页PPT)deepseek技术全景解析重塑全球AI生态的中国力量.pptxVIP

(48页PPT)deepseek技术全景解析重塑全球AI生态的中国力量.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

.2025

|NDUSTRYRESEARCHREP0RT

DeepSeek技术全景解析

重塑全球AI生态的中国力量

编制:智研咨询

chyxx服务0-9383;

01DeepSeek企业背景

02Deepseek模型家族

03Deepseek技术创新

04Deepseek商业模式

05Deepseek应用场景

06AI某省市场现状

07Deepseek对Al行业影响总结;

PART01

DeepSeek企业背景

最全面的产业分析●可预见的行业趋势;

DeepSeek背靠资金实力雄厚的幻方量化

2025年1月,DeepSeek发布其最新开源模型DeepSeekR1,再度引发全球人工智能领域关注。DeepSeek,全称杭州深度求索人工某著名企业,成立于2023年7月17日,一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。DeepSeek???靠资金实力雄厚的幻方量化,DeepSeek创始人为,同时也是幻方量化的创始人,幻方量化是国内头部量化私募管理人,旗下有两家百亿量化私募,分别是2015年6月成立的浙江九章资产和2016年2月成立的宁波幻方量化。

DeepSeek公司简介DeepSeek股权结构;

DeepSeek大模型不断优化迭代

回顾其发展历史,2024年1月,发布第一版大模型—-DeepSeekLLM,这个版本使用传统的Transformer架构,但在训练方面,

已经明显体现出DeepSeek团队通过不断优化训练策略,达到节约成本,提高效率的思想,这点也在后续的模型迭代中被发扬光大。2024年5月,DeepSeek-V2发布,从这一代开始,DeepSeek模型开始使用混合专家(MoE)架构,这是传统Transformer

架构的一种改进和扩展,该架构使DeepSeek模型能以更低的计算成本进行更复杂的推理,极大提升了模型的性能。2024年12月,DeepSeek-V3上线并开源,V3版本对MoE架构进行了进一步优化,在维持低训练成本的同时,稳定性与多方面性能表现都达到了与领先闭源模型相当的水平。2025年1月,DeepSeek-R1正式发布,R1模型的推理能力得到极大加强,与OpenAl-01模型不相上下,且推理过程完全透明,因此在全球范围备受关注。;

.一PART02

Deepseek模型家族

最全面的产业分析●可预见的行业趋势

服务0-9383;

从低成本的DeepSeek-V2,到超低价格的DeepSeek-V3,再到引起世界广泛关注的DeepSeek-R1,DeepSeek的成功主要依赖于

DeepSeek自身深厚的技术积累和持续的技术创新突破。

DeepSeek-V2采用的是MoE架构,全参数量为236B,激活参数量是21B。其采用了两大创新技术:DeepSeekMoE架构和多头潜

在注意力(MLA),使得DeepSeek-V2的训练成本大为降低并且提升推理速度。MLA通过将Key-Value缓存压缩为潜在向量来提高推理效率,从而提高吞吐量。DeepSeekMoE架构允稀疏计算进行有效的推理。相比DeepSeekLLM67B(Dense),DeepSeek-V2的性能更强,某省市了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。

DeepSeek-V2性能;

●2.2DeepSeek-V3模型deepseek

DeepSeek-V3模型性能大幅提升

DeepSeek-V3是一个强大的专家混合(MoE)语言模型,具有671B个总参数,激活参数量为37B。相较历史模型,DeepSeek-V3在推理速度上有了大幅提升。此外在目前大模型主流榜单中,DeepSeek-V3在开源模型中位

文档评论(0)

sky_runner + 关注
实名认证
文档贡献者

持续学习提升自我,并在职场中热心帮助他人成长。

1亿VIP精品文档

相关文档