数据资产全过程管理——解锁DeepSeek智能引擎(林建兴)-2025-.pdfVIP

  • 1
  • 0
  • 约1.68万字
  • 约 63页
  • 2026-02-15 发布于广东
  • 举报

数据资产全过程管理——解锁DeepSeek智能引擎(林建兴)-2025-.pdf

数据资产全过程管理

——解锁DeepSeek智能引擎

演讲嘉宾:林建兴时间:2025年2月5日

混合专家(MoE)架构

DeepSeek-V3拥有6710亿参数,但在实际运行中,每个输入仅激活370

亿参数,这种选择性激活的方式大大降低了计算成本,同时保持了高性能

高效的训练框架01多头潜在注意力(MLA)

采用HAI-LLM框架,支持16-way该架构在DeepSeek-V2中已经得到

PipelineParallelism(PP)、64-way验证,能够实现高效的训练和推理

ExpertParallelism(EP)和ZeRO-1

文档评论(0)

1亿VIP精品文档

相关文档