计算机行业深度报告:国产化训练从0到1里程碑,战略意义大于性能意义.docxVIP

  • 0
  • 0
  • 约1.76万字
  • 约 28页
  • 2026-05-01 发布于湖南
  • 举报

计算机行业深度报告:国产化训练从0到1里程碑,战略意义大于性能意义.docx

证券研究报告

证券研究报告·行业深度报告·计算机

1/18

请务必阅读正文之后的免责声明部分

请务必阅读正文之后的免责声明部分

计算机行业深度报告

计算机行业深度报告

国产化训练从0到1里程碑,战略意义大于性能意义

2026年04月30日

增持(维持)

投资要点

n重要意义:国产开源大模型在国产算力训练适配领域以及百万级上下文能力实现了里程碑式突破。

nDeepSeekV4首次由华为昇腾芯片参与训练。DeepSeekV4Flash是首个公开说明训练侧使用国产算力的通用大模型,通过三大核心设计实现了去英伟达化的技术布局。(1)引入MXFP4量化感知训练,对MoE专家权重与索引器QK路径实现FP4量化,降低了对NVIDIAFP8生态的绑定,可无缝适配华为昇腾、寒武纪等国产芯片;(2)采用TileLang领域专用语言开发底层算子,脱离CUDA生态强绑定,可跨硬件平台编译,降低向国产芯片的迁移成本;(3)自研MegaMoE2融合内核,实现专家并行的细粒度通信计算重叠,已在华为昇腾平台完成适配跑通,解决了国产硬件环境下MoE模型的通信瓶颈。

n性能表现:整体跻身全球第一梯队,多项核心指标比肩甚至超越国际顶级闭源模型。(1)知识储备:DeepSeek-V4-Pro-Max在SimpleQA-Ver

文档评论(0)

1亿VIP精品文档

相关文档