- 1
- 0
- 约1.63千字
- 约 4页
- 2026-03-03 发布于辽宁
- 举报
DeepSeekV4+昇腾会有什么化学反应?
这两天圈子里炸了锅。DeepSeekV4即将发布,但这次做了一个反常决定:优先向华为等国内厂商开放测试,把英伟达、AMD拒之门外。
这不是小事。
过去大模型发布,第一选择永远是英伟达。能跑在H100上,意味着性能被认可,意味着能卖给全球客户。但现在,DeepSeek把优先级给了华为。
背后逻辑是什么?纷繁君把资料捋了一遍,今天聊聊这个事。
一、DeepSeek为什么选华为?
先看几个数据。
DeepSeek此前已经在昇腾平台上完成了模型迁移,通过华为的KernelCAT工具,推理速度提升了超过35倍。这是一个很夸张的数字。意味着同样的硬件,能跑出更多的Token,能服务更多的用户。
DeepSeekV4这次主打的是1M超长上下文窗口,配合华为的Atlas950超节点(8EFLOPSFP8算力),两者形成深度协同。技术上跑得通,性能上有增益,这是合作的基础。
但更深层的原因,是战略安全。
DeepSeek不是小公司了。它的API调用量在春节后暴涨,用户排队时长超过10小时。这种体量的公司,不可能把所有鸡蛋放在一个篮子里。英伟达的卡交期长、价格高、还有被限制的风险。找一家国产芯片做深度适配,是必然选择。
华为正好接住了。
二、昇腾950,已经不是备胎
很多人对国产芯片的印象还停留在“能用但不好用”。这个印象该更新了。
性能上,950单卡推理能力实测已超过A100,综合性价比优于H100。国内不少大模型厂商实测发现,在单台国产算力节点上,性能可以媲美由两台国际主流GPU组成的计算集群。
价格上,950Pro低配版单价约5万元,而竞品H100单价约10万元。一半的价格,相当的性能,这叫商业竞争力。
产能上,国内先进制程扩产,优先保障昇腾。二线厂商还在排队等产能,昇腾已经拿到入场券。
所以今年互联网大厂对昇腾的导入目标,普遍翻倍。字节20万张,腾讯6到7万张,百度3万张。这不是政策驱动的“备胎”,是实打实的商业选择。可能受益的厂家可查看之前的文章。
三、Token出海,新叙事刚刚开始
OpenClaw带动的Agent热潮,不是简单出圈,是新一轮Token大爆发的开始。
数据会说话:
-2026年2月的Token调用量,是2025年2月的13倍
-字节高级会员排队人数破10万,排队时长超10小时
-智谱、Kimi在公众号上公开找卡,半夜想用GLM-5还要排一千多人
为什么突然这么缺卡?因为Agent模式和传统聊天,消耗的不是一个量级。
传统对话是一次性交互,Agent是自主工作、思维链、多模态调用。后者消耗的算力是前者的几倍甚至几十倍。而且这只是开始,下一波是物理AI、机器人、自动驾驶,消耗会更恐怖。
这就引出一个新叙事:Token出海。
过去,我们用衬衫换美元。今天,我们用Token换回美元、数据和影响力。美国用户调用智谱的API,数据经海底光缆传到中国数据中心,由国产算力消耗中国电力完成推理。电力不出境,但价值通过Token跨境交付。
只要世界的尽头还需要计算,中国的Token就永远有买家。因为在这个数字时代,算力就是权力,而廉价的算力,是绝对的权力。
四、拐点已至
过去几年,国产芯片一直在追赶。从“能用”到“好用”,从“替代选项”到“最优解”,这条路走了很久。
但DeepSeekV4选择华为,是一个标志性事件。它意味着国产大模型与国产芯片的适配,将跑在全球前面。不再是别人定义标准,我们去适配;而是我们一起定义标准,让全球来适配我们。
华为加入Linux基金会的AAIF基金会,与OpenAI、谷歌共同参与全球自主AI标准制定。昇腾生态从被动适配转向主动定义,内循环闭合加外循环卡位,双轨并进。
2026年,是国产算力从追赶到爆发的关键分水岭。Token出海的新叙事刚刚开始,昇腾产业链将同时享受国内需求爆发与海外渗透的双重红利。
拐点已至,值得重视。
原创力文档

文档评论(0)