- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek
消费电子行业大模型新型应用最佳实践分享
陈树荣
腾讯云智能商业化
2025.03
大模型产业生态图
大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业:
……
•自研大模型结构的企业LEVEL1
研发模型结构
LEVEL2
•研发预训练模型的企业研发预训练模型……
•基于自己数据SFT做自己模型的企业LEVEL3
•基于开源或者基于国内预训练模型结基于模型SFT
合自己数据进行微调的企业……
LEVEL4
•不用训练,直接调
用大模型API的企业直接调用……
国内外大模型百花齐放
国外头部
国内大厂
国内创业明星
全球开源社区
DeepSeek推动国产模型达到新的高度
DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新
和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了
广泛认可。其中:
●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)
语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任
务(知识问答、内容生成等)领域表现出色。
●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型,在数学、代
码生成和逻辑推断等复杂推理任务上表现优异。
更低的研发成本*更高效资源利用开源模型比肩头部闭源
$5.6Mvs.OpenAI’s使用~2,000GPUs,竞品使用60%+指标优于
$100M+10,000+GPUsLlama3.1Claude-3.5GPT-
4o
打破大模型技术壁垒人工智能的Sputnik时刻
重挫美国科技公司股价,英伟被美国及其盟友列入各种限制
达市值下跌5900亿
大模型时代企业AI项目“烟囱式”建设痛点越发严重
智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等AI资产管理分散,无法沉淀复用和统一运用。
投资浪费适应性差项目周期长底层统一上层统一中层异构
业务系统A业务系统B业务系统C
业务系统A业务系统B业务系统C
对外出入口A对外出入口B
文档评论(0)