- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SemiAnalysis报告:对这次DeepSeek事件的分析
整理者:AI君主?亦
原?地址:/2025/01/31/deepseek-debates/
深度求索的故事席卷全球
深度求索(DeepSeek)的故事在全球引起了轰动。在过去的?周?,深度求索成了全球各界唯?的热议话题。?前,深度求索的?访问量远超Claude、Perplexity,甚?超过了Gemini。
但对于密切关注这?领域的?来说,这其实并?什么“新鲜事”,令?瞩?的是?们对它的疯狂炒
作。?期以来,SemiAnalysis?直认为深度求索极具天赋,但美国?众此前并不关注。当全世界终于开始关注时,却陷?了?种脱离现实的疯狂炒作。?个?来,我们?直在谈论深度求索(每个链接都是例证)。这家公司并不新。
我们想强调的是,舆论风向与上个?相?发?了逆转。上个?,当规模定律被打破时,有?认为这对英伟达(Nvidia)和GPU不利;如今,?有?说算法改进速度过快。我们已经破除了这些谬论。
如今的舆论认为,深度求索效率极?,我们不再需要更多计算资源,?且由于模型的变化,现在?切都存在?量过剩产能。虽然杰?斯悖论(Jevonsparadox)也被过度炒作了,但它更接近现实情况。这些模型已经对H100和H200的定价产?了实际影响,刺激了需求。
深度求索与High-Flyer(幻?)
High-Flyer是?家中国对冲基?,也是将??智能应?于交易算法的早期adopters。他们很早就意识到了??智能在?融领域之外的潜?,以及规模化的关键意义。因此,他们不断增加GPU的储备。在使?数千个GPU集群对模型进?试验后,High-Flyer在2021年出?限制实施前投资购买了10000个A100GPU,这?举措取得了回报。随着High-Flyer的发展,他们在2023年5?决定分拆出“深度求索”,?标是更专注地追求??智能能?的进?步提升。当时,由于缺乏商业模式,外部投资者对??智能兴趣寥寥,High-Flyer便??出资成?了这家公司。如今,High-Flyer和深度求索经常共享??和计算资源。
深度求索如今已发展成为?项认真且协同的事业,绝?许多媒体声称的“副业”。我们确信,即便考虑到出?管制因素,他们在GPU上的投资也超过5亿美元。
GPU情况
我们认为他们拥有约50000个HopperGPU,但这并不等同于50000个H100,?些?存在这样的误解。英伟达为遵守不同规定,?产了H100的多种变体(H800、H20),?前中国的模型供应商仅能获得H20。需要注意的是,H800的计算能?与H100相同,但?络带宽较低。
我们认为深度求索拥有约10000个H800和10000个H100。此外,他们还订购了更多H20。在过去9个??,英伟达?产了超过100万个专供中国的GPU。这些GPU由High-Flyer和深度求索共享,并在?定程度上进?了地理分布。它们被?于交易、推理、训练和研究。如需更具体的详细分析,请参考我们的《加速器模型》。
深度求索??智能的总拥有成本
我们的分析显?,深度求索的服务器总资本?出接近13亿美元,运营这些集群的成本?达7.15亿美元。同样,所有??智能实验室和超?规模数据中?为了各种任务(包括研究和训练),拥有的GPU
数量?单次训练所需的更多,因为资源集中存在?定挑战。X.AI作为?个??智能实验室?较独特,它所有的GPU都集中在?个地?。
深度求索只从中国招聘?才,不看重过往资历,?度关注能?和求知欲。他们经常在北京?学和浙江?学等顶尖?学举办招聘活动,招聘?告中甚?吹嘘员?能?限制使?数万个GPU。他们极具竞争?,据说为有潜?的候选?提供超过130万美元的年薪,远超中国其他?型科技公司和??智能实验室,如Moonshot。他们?前约有150名员?,且规模还在迅速扩?。岗位角?不?定预先设定,招聘?员有?定灵活性。
历史表明,资?充?且专注的?型初创公司往往能突破极限。深度求索不像?歌那样官僚主义,由于是?筹资?,他们能迅速将想法付诸实践。不过,和?歌?样,深度求索(在很?程度上)运营??的数据中?,不依赖外部机构或供应商。这为实验开辟了更多空间,使他们能够在整个技术栈上进?创新。
我们认为他们是?前最好的“开放权重”实验室,超过了Meta的L
文档评论(0)