- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SemiAnalysis报告:对这次DeepSeek事件的分
析
整理者:AI君主⼩亦
原⽂地址:/2025/01/31/deepseek-debates/
深度求索的故事席卷全球
深度求索(DeepSeek)的故事在全球引起了轰动。在过去的⼀周⾥,深度求索成了全球各界唯⼀的热
议话题。⽬前,深度求索的⽇访问量远超Claude、Perplexity,甚⾄超过了Gemini。
但对于密切关注这⼀领域的⼈来说,这其实并⾮什么“新鲜事”,令⼈瞩⽬的是⼈们对它的疯狂炒
作。⻓期以来,SemiAnalysis⼀直认为深度求索极具天赋,但美国⼤众此前并不关注。当全世界终于
开始关注时,却陷⼊了⼀种脱离现实的疯狂炒作。⼏个⽉来,我们⼀直在谈论深度求索(每个链接都
是例证)。这家公司并不新。
我们想强调的是,舆论⻛向与上个⽉相⽐发⽣了逆转。上个⽉,当规模定律被打破时,有⼈认为这对
英伟达(Nvidia)和GPU不利;如今,⼜有⼈说算法改进速度过快。我们已经破除了这些谬论。
如今的舆论认为,深度求索效率极⾼,我们不再需要更多计算资源,⽽且由于模型的变化,现在⼀切
都存在⼤量过剩产能。虽然杰⽂斯悖论(Jevonsparadox)也被过度炒作了,但它更接近现实情况。
这些模型已经对H100和H200的定价产⽣了实际影响,刺激了需求。
深度求索与High-Flyer(幻⽅)
High-Flyer是⼀家中国对冲基⾦,也是将⼈⼯智能应⽤于交易算法的早期adopters。他们很早就意识
到了⼈⼯智能在⾦融领域之外的潜⼒,以及规模化的关键意义。因此,他们不断增加GPU的储备。在
使⽤数千个GPU集群对模型进⾏试验后,High-Flyer在2021年出⼝限制实施前投资购买了10000个
A100GPU,这⼀举措取得了回报。随着High-Flyer的发展,他们在2023年5⽉决定分拆出“深度求
索”,⽬标是更专注地追求⼈⼯智能能⼒的进⼀步提升。当时,由于缺乏商业模式,外部投资者对⼈
⼯智能兴趣寥寥,High-Flyer便⾃⾏出资成⽴了这家公司。如今,High-Flyer和深度求索经常共享⼈
⼒和计算资源。
深度求索如今已发展成为⼀项认真且协同的事业,绝⾮许多媒体声称的“副业”。我们确信,即便考
虑到出⼝管制因素,他们在GPU上的投资也超过5亿美元。
GPU情况
我们认为他们拥有约50000个HopperGPU,但这并不等同于50000个H100,⼀些⼈存在这样的误
解。英伟达为遵守不同规定,⽣产了H100的多种变体(H800、H20),⽬前中国的模型供应商仅能
获得H20。需要注意的是,H800的计算能⼒与H100相同,但⽹络带宽较低。
我们认为深度求索拥有约10000个H800和10000个H100。此外,他们还订购了更多H20。在过去
9个⽉⾥,英伟达⽣产了超过100万个专供中国的GPU。这些GPU由High-Flyer和深度求索共享,
并在⼀定程度上进⾏了地理分布。它们被⽤于交易、推理、训练和研究。如需更具体的详细分析,请
参考我们的《加速器模型》。
深度求索⼈⼯智能的总拥有成本
我们的分析显⽰,深度求索的服务器总资本⽀出接近13亿美元,运营这些集群的成本⾼达7.15亿美
元。同样,所有⼈⼯智能实验室和超⼤规模数据中⼼为了各种任务(包括研究和训练),拥有的GPU
数量⽐单次训练所需的更多,因为资源集中存在⼀定挑战。X.AI作为⼀个⼈⼯智能实验室⽐较独特,
它所有的GPU都集中在⼀个地⽅。
深度求索只从中国招聘⼈才,不看重过往资历,⾼度关注能⼒和求知欲。他们经常在北京⼤学和浙江
⼤学等顶尖⼤学举办招聘活动,招聘⼴告中甚⾄吹嘘员⼯能⽆限制使⽤数万个GPU。他们极具竞争
⼒,据说为有潜⼒的候选⼈提供超过130万美元的年薪,远超中国其他⼤型技公司和⼈⼯智能实验
室,如Moonshot。他们⽬前约有150名员⼯,且规模还在迅速扩⼤。岗位⻆⾊不⼀定预先设定,招
聘⼈员有⼀定灵活性。
历史表明,资⾦充⾜且专注的⼩型初创公司往往能突破极限。深度求索不像⾕歌那样官僚主义,由于
是⾃筹资⾦,他们能迅速将想法付诸实践。不过,和⾕歌⼀样,深度求索(在很⼤程度上)运营⾃⼰
的数据中⼼,不依赖外部机构或供应商。这为实验开辟了更多空间,使他们能够在整个技术栈上进⾏
创新。
我们认为他们是⽬前最好的“开放权重”实验室,超过了Meta的
您可能关注的文档
- 2024年贸易数据分析:强美元影响出口的两种机制.pdf
- 2024年私募基金年报-中信建投证券托管部.pdf
- 2024年四季度美国经济表现及人民币走势观点分享 -新永安.pdf
- 2025年生物制药行业发展趋势报告.pdf
- 边缘学习—让所有人(新手和专家)受益于 AI 的强大功能 .pdf
- 传媒-DeepSeek激活创新竞争,AI应用迎来“安卓时刻”.pdf
- 电力设备行业深度报告:高功率密度智算数据中心资本开支扩张,供配电系统迎来升级迭代.pdf
- 电气设备:碳资产怎么评估.pdf
- 房地产市场报告 -中指丨春节楼市观察与市场展望-20250205.pdf
- 计算机-AI编程对软件行业意味着什么,.pdf
- 中国多次直拉单晶炉行业市场占有率及投资前景预测分析报告.pdf
- 中国多功能阀门行业市场占有率及投资前景预测分析报告.pdf
- 中国多工位直接成衣打印机行业市场占有率及投资前景预测分析报告.pdf
- 部编版九年级下册语文详细教学计划及教学进度安排.docx
- 宁夏吴忠市同心县四校2024-2025学年高一上学期期末联考试地理试题(解析版).docx
- 中国多点平均温度计行业市场占有率及投资前景预测分析报告.pdf
- 2024年重庆市高考物理试题含答案解析.docx
- 2024年天津市高考政治试题含答案解析.docx
- 2024年天津市高考物理试题含答案解析.docx
- 中国多弹簧泥浆密封行业市场占有率及投资前景预测分析报告.pdf
文档评论(0)