网站大量收购独家精品文档,联系QQ:2885784924

AI行业跟踪47期:大模型与流量入口加速合作,看好AI云产业链.docx

AI行业跟踪47期:大模型与流量入口加速合作,看好AI云产业链.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

索引

索引

内容目录

一、AI行业重点事件点评 3

DeepSeek应用部署加速落地,看好云计算基础设施发展机遇 3

DeepSeek的技术创新 3

DeepSeek的多种应用部署方式 3

DeepSeek加速云计算发展和基础设施投入,加速国产卡的国产替代进程 5

微信测试接入DeepSeek,利好腾讯AIDC产业链 6

苹果与阿里合作,助力iphone的本土化AI功能开发 6

二、AI行业动态一览 7

国外行业动态 7

AI大模型 7

应用 7

国内行业动态 8

AI大模型 8

应用 8

三、AI行情回顾:A股算力租赁板块领涨,美股涨幅明显 8

四、投资建议:持续关注AI应用和算力基础设施 9

五、风险提示 9

图表目录

图1:API应用架构设计 4

图2:AMD平台DeepSeekR1Distil支持硬件清单 5

图3:A股AI行业细分板块周涨跌幅对比(02.10-02.14) 8

图4:美股AI行业细分板块周涨跌幅对比(02.10-02.14) 8

表1:DeepSeek技术创新 3

一、AI行业重点事件点评

DeepSeek应用部署加速落地,看好云计算基础设施发展机遇

DeepSeek的技术创新

DeepSeek自问世以来便凭借着其独特的技术创新优势,极大地提高了效率,在全球范围内掀起热潮。

表1:DeepSeek技术创新

创新维度 具体方式 创新介绍

创新维度 具体方式 创新介绍

模型架构创新

混合专家模型(MoE)架构

通过细粒度专家划分,将专家做更细粒度拆分,在保持参数量和激活参数量不变的情况下,增加了专家数量,使组合更灵活。

多头潜在注意力机制(MLA)把注意力机制中的键和值压缩为低秩潜在向量,减少内存占用和计算量,提升推理速度。

与传统PPO算法不同,GRPO通过对一组响应进行相对评估来优化模型,无需单独的评估模型估算每个

群体相对策略优化(GRPO)

响应价值,消除了对评估模型的需求,显著降低计算开销。

训练方法创新

分层训练策略

训练初期以较低精度快速处理数据构建初步框架,能在短时间内对数据进行大致处理和特征提取,为后续训练奠定基础。

其他技术创新

自适应动态资源分配技术

多Token预测(MTP)技术

稀疏注意力机制

FP8混合精度训练

DeepSeek-R1蒸馏

可根据模型训练的实时需求,自动监测模型训练过程中的资源使用情况,如计算量、内存占用等,然后根据结果进行分配。

使模型训练时可同时预测多个连续位置的Token,能并行处理多个Token的预测任务,相比逐个预测

Token,大大提高了训练速度。

采用动态稀疏注意力机制,能根据输入内容自动识别关键段落或句子,只对这些部分进行注意力计算,降低计算开销。

结合FP8、BF16和FP32三种数据类型,在前向传播中使用FP8计算,利用FP8存储空间小、计算速度快的特点,提高计算效率,降低内存占用。

DeepSeek-R1蒸馏出了六个小模型,参数从小到大分别为1.5B、7B、8B、14B、32B以及70B。这六个模型同样完全开源,将大模型知识和推理能力迁移到更小的模型中,以提升小模型性能并降低计算资源需求。

腾讯技术工程、 研发中心

DeepSeek的多种应用部署方式

DeepSeek的应用部署在云端与本地部署协同演进,包括1、公有云+API调用服务;2、私有化部署;3、端侧设备的本地化部署。

公有云+API调用的灵活轻量部署:在数字化转型加速的当下,众多企业期望以较低成本快速接入先进的AI能力。公有云平台提供的API调用服务完美契合了这一

需求,企业借助阿里云、腾讯云等公有云,能便捷地调用DeepSeek大模型。这种模式的灵活性还体现在企业可根据业务量灵活调整调用量,无需前期大量的硬件和研发投入。

图1:API应用架构设计

didispace, 研发中心

保障数据安全的私有化部署:主要体现在金融、医疗等行业。这些行业对数据安全和隐私保护有着严苛的法规要求,传统模型部署需要非常高昂的算力成本,而DeepSeek-R1大模型可以以更低的成本、基于国产GPU集群实现满血版R1和全系列蒸馏模型的部署,确保了数据在内部环境流转,避免了数据泄露风险,还能根

据企业自身业务特点进行模型的深度定制,提升模型在特定业务场景下的准确性和实用性。

DeepSeek支持多种硬件架构,包括主流GPU和边缘设备,显著降低了私有化部署的成本和门槛,这种特性使得垂直行业大型企业和中小企业能够以较低的投入实现私有化部署。

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档