计算机行业深度报告:国产化训练从0到1里程碑,战略意义大于性能意义.pptxVIP

  • 1
  • 0
  • 约1.62万字
  • 约 10页
  • 2026-05-09 发布于湖南
  • 举报

计算机行业深度报告:国产化训练从0到1里程碑,战略意义大于性能意义.pptx

投资要点

n重要意义:国产开源大模型在国产算力训练适配领域以及百万级上下文能力实现了里程碑式突破。

nDeepSeekV4首次由华为昇腾芯片参与训练。DeepSeekV4Flash是首个公开说明训练侧使用国产算力的通用大模型,通过三大核心设计实现了去英伟达化的技术布局。(1)引入MXFP4量化感知训练,对MoE专家权重与索引器QK路径实现FP4量化,降低了对NVIDIAFP8生态的绑定,可无缝适配华为昇腾、寒武纪等国产芯片;(2)采用TileLang领域专用语言开发底层算子,脱离CUDA生态强绑定,可跨硬件平台编译,降低向国产芯片的迁移成本;(

文档评论(0)

1亿VIP精品文档

相关文档