- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek
消费电子行业大模型新型应用最佳实践分享
陈树荣
腾讯云智能商业化
2025.03
大模型产业生态图
大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业:
……?
……
?自研大模型结构的企业
研发模型结构
LEVEL2
……研发预训练模型
……
?基于自己数据SFT做自己模型的企业?基于开源或者基于国内预训练模型结
?基于自己数据SFT做自己模型的企业
?基于开源或者基于国内预训练模型结合自己数据进行微调的企业
……基于模型SFT
……
?不用训练,直接调用大模型API的企业……LEVEL4直接调用
?不用训练,直接调用大模型API的企业
……
国内外大模型百花齐放
国外头部
国内大厂
国内创业明星
全球开源社区
DeepSeek推动国产模型达到新的高度
DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了广泛认可。其中:
●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任务(知识问答、内容生成等)领域表现出色。
●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型,在数学、代码生成和逻辑推断等复杂推理任务上表现优异。
更低的研发成本*
$5.6Mvs.OpenAI’s
$100M+
更高效资源利用
使用~2,000GPUs,竞品使用
10,000+GPUs
开源模型比肩头部闭源
60%+指标优于
Llama3.1Claude-3.5GPT-
4o
打破大模型技术壁垒
重挫美国科技公司股价,英伟达市值下跌5900亿
人工智能的Sputnik时刻
被美国及其盟友列入各种限制
大模型时代企业AI项目“烟囱式”建设痛点越发严重
智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等AI资产管理分散,无法沉淀复用和统一运用。
AI项目的烟囱式建设
业务系统A
业务系统A
业务系统B
业务系统B
业务系统C
业务系统C
集约敏捷的AI中台式建设
大模型工具链支持大模型研发至应用全栈技术
客户业务系统知识引擎应用数智人智能客服
文档拆分大模型API(DeepSeek/客户专属模型/混元/行业模型等)文档解析向量检索开放对接知识引擎?模型+训练平台+应用构建平台全链路能力。?提供从训练——推理
文档拆分
大模型API
(DeepSeek/客户专属模型/混元/行业模型等)
文档解析
向量检索
开放
对接知识引擎
?模型+训练平台+应用构建平台全链路能力。
?提供从训练——推理——应用的一站式丝滑服务体验
?全面接入deepseek模型
多轮改写
RAG知识文档知识问答
工作流
联网搜索
配置项
模型API
混元系列模型
模型服务
行业大模型客户专属模型
模型API
内置DS全系模型模型部署服务管理
内置DS全系模型
模型部署服务管理
一键发起模型部署 兼容OpenAI接口规范复刻Deepseel的推理加速能力
一键发起模型部署
TI平台大模型广场
TI平台
大模型广场
模型训练大模型精调解决方案一键发起模型训练
模型训练
大模型精调
解决方案
一键发起模型训练
算力计算集群(H20/A10等)国产算力适配高性能计算网络架构
腾讯云TI平台
大模型模型训练和推理开发平台,灵活精调和部署私有DeepSeek
腾讯云TI平台产品核心能力
训练工坊模型部署多种训练工具:具备周期调度能力的可视化建模,低门槛深度学习场景化工具,交互式代码开发工具,专业的通用任务调度工具分布式稳定训练:支持多机多卡大规模训练,故障自动重启续训
训练工坊
模型部署
多种训练工具:具备周期调度能力的可视化建模,低门槛深度学习场景化工具,交互式代码开发工具,专业的通用任务调度工具
分布式稳定训练:支持多机多卡大规模训练,故障自动重启续训
镜像制作:基于jupyter的高效自定义镜像制作工具
训练指标监控:丰富的指标监控及告警,覆盖网络及GPU算力
内置训练加速:全新升级
您可能关注的文档
- 2025年上半年食品饮料品类东南亚市场洞察与选品参考报告-Shopee.docx
- 2025年食品餐饮行业舆情分析报告:蛋糕巨头好利来陷“加班门”四川泸州食品安全新规引热议.docx
- 2025年央视3.15晚会传播观察报告-新联财通.docx
- 2025年制造行业精选案例集-博睿数据.docx
- 2025年中国酒店业数字化转型趋势报告-石基信息.docx
- 2025年中国养生水行业:养生饮品的崛起与创新之路.docx
- 2025中国汽车出海洞察——泰国篇-汽车之家.docx
- ChatGPT的情感使用与情感幸福感研究.docx
- 艾瑞咨询:2025年奢侈品行业网络营销监测报告.docx
- 方程豹 豹5用户研究(用户画像、购买、满意度等)-电动汽车用户联盟.docx
最近下载
- 2022雅马哈 XSR900-MTM890中文维修手册.pdf VIP
- 新人音版音乐一年级下册《第四单元 游戏》大单元整体教学设计.docx
- 钢结构厂房建设工程造价指标(清单计价).docx
- BIAMP NEXIA连接使用中文教程.pdf
- 一文读懂《中国人民解放军新共同条令》PPT课件.pptx
- 2024年江苏省南京市中考语文试题卷(含答案).docx
- 老挝波罗芬高原铝土矿地质特征及开发利用.docx VIP
- 电机在线监测与诊断.ppt VIP
- SAEJ2045-1998 燃油系统管组件的性能要求(中文翻译).pdf VIP
- 2024年北京电子科技职业学院高职单招(英语/数学/语文)笔试题库含答案解析.docx
文档评论(0)