DeepSeek消费电子行业大模型新型应用最佳实践分享.pptxVIP

  • 0
  • 0
  • 约1.57千字
  • 约 28页
  • 2026-06-28 发布于贵州
  • 举报

DeepSeek消费电子行业大模型新型应用最佳实践分享.pptx

DeepSeek

消费电子行业大模型新型应用最佳实践分享

;

LEVEL1

研发模型结构

LEVEL2

研发预训练模型

LEVEL3

基于模型SFT

LEVEL4直接调用;

国外头部

国内大厂

国内创业明星;

DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了广泛认可。其中:

●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任务(知识问答、内容生成等)领域表现出色。

●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型,在数学、代码生成和逻辑推断等复杂推理任务上表现优异。;;

知识引擎;

腾讯云TI平台

大模型模型训练和推理开发平台,灵活精调和部署私有DeepSeek;;;

核心收益

满血版模型一键精调

?256卡H20

?全参SFT

?8小时

蒸馏后模型多模式精调

?全参+LoRA双模式

?低至1卡A10;

DeepSeek蒸馏方案

DeepSeek全系大语言模型支持SFT;

TI

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档