- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
索引
索引
内容目录
一、AI行业重点事件点评 3
DeepSeek应用部署加速落地,看好云计算基础设施发展机遇 3
DeepSeek的技术创新 3
DeepSeek的多种应用部署方式 3
DeepSeek加速云计算发展和基础设施投入,加速国产卡的国产替代进程 5
微信测试接入DeepSeek,利好腾讯AIDC产业链 6
苹果与阿里合作,助力iphone的本土化AI功能开发 6
二、AI行业动态一览 7
国外行业动态 7
AI大模型 7
应用 7
国内行业动态 8
AI大模型 8
应用 8
三、AI行情回顾:A股算力租赁板块领涨,美股涨幅明显 8
四、投资建议:持续关注AI应用和算力基础设施 9
五、风险提示 9
图表目录
图1:API应用架构设计 4
图2:AMD平台DeepSeekR1Distil支持硬件清单 5
图3:A股AI行业细分板块周涨跌幅对比(02.10-02.14) 8
图4:美股AI行业细分板块周涨跌幅对比(02.10-02.14) 8
表1:DeepSeek技术创新 3
一、AI行业重点事件点评
DeepSeek应用部署加速落地,看好云计算基础设施发展机遇
DeepSeek的技术创新
DeepSeek自问世以来便凭借着其独特的技术创新优势,极大地提高了效率,在全球范围内掀起热潮。
表1:DeepSeek技术创新
创新维度 具体方式 创新介绍
创新维度 具体方式 创新介绍
模型架构创新
混合专家模型(MoE)架构
通过细粒度专家划分,将专家做更细粒度拆分,在保持参数量和激活参数量不变的情况下,增加了专家数量,使组合更灵活。
多头潜在注意力机制(MLA)把注意力机制中的键和值压缩为低秩潜在向量,减少内存占用和计算量,提升推理速度。
与传统PPO算法不同,GRPO通过对一组响应进行相对评估来优化模型,无需单独的评估模型估算每个
群体相对策略优化(GRPO)
响应价值,消除了对评估模型的需求,显著降低计算开销。
训练方法创新
分层训练策略
训练初期以较低精度快速处理数据构建初步框架,能在短时间内对数据进行大致处理和特征提取,为后续训练奠定基础。
其他技术创新
自适应动态资源分配技术
多Token预测(MTP)技术
稀疏注意力机制
FP8混合精度训练
DeepSeek-R1蒸馏
可根据模型训练的实时需求,自动监测模型训练过程中的资源使用情况,如计算量、内存占用等,然后根据结果进行分配。
使模型训练时可同时预测多个连续位置的Token,能并行处理多个Token的预测任务,相比逐个预测
Token,大大提高了训练速度。
采用动态稀疏注意力机制,能根据输入内容自动识别关键段落或句子,只对这些部分进行注意力计算,降低计算开销。
结合FP8、BF16和FP32三种数据类型,在前向传播中使用FP8计算,利用FP8存储空间小、计算速度快的特点,提高计算效率,降低内存占用。
DeepSeek-R1蒸馏出了六个小模型,参数从小到大分别为1.5B、7B、8B、14B、32B以及70B。这六个模型同样完全开源,将大模型知识和推理能力迁移到更小的模型中,以提升小模型性能并降低计算资源需求。
腾讯技术工程、 研发中心
DeepSeek的多种应用部署方式
DeepSeek的应用部署在云端与本地部署协同演进,包括1、公有云+API调用服务;2、私有化部署;3、端侧设备的本地化部署。
公有云+API调用的灵活轻量部署:在数字化转型加速的当下,众多企业期望以较低成本快速接入先进的AI能力。公有云平台提供的API调用服务完美契合了这一
需求,企业借助阿里云、腾讯云等公有云,能便捷地调用DeepSeek大模型。这种模式的灵活性还体现在企业可根据业务量灵活调整调用量,无需前期大量的硬件和研发投入。
图1:API应用架构设计
didispace, 研发中心
保障数据安全的私有化部署:主要体现在金融、医疗等行业。这些行业对数据安全和隐私保护有着严苛的法规要求,传统模型部署需要非常高昂的算力成本,而DeepSeek-R1大模型可以以更低的成本、基于国产GPU集群实现满血版R1和全系列蒸馏模型的部署,确保了数据在内部环境流转,避免了数据泄露风险,还能根
据企业自身业务特点进行模型的深度定制,提升模型在特定业务场景下的准确性和实用性。
DeepSeek支持多种硬件架构,包括主流GPU和边缘设备,显著降低了私有化部署的成本和门槛,这种特性使得垂直行业大型企业和中小企业能够以较低的投入实现私有化部署。
您可能关注的文档
- 2024Q4,指数债基大放异彩.docx
- 2024年年报业绩预告点评:电子通信行业预喜率高且业绩超预期个股集中,计算机、医药和地产链有待困境反转.docx
- 2024年信用债违约复盘:24年信用环境有哪些变化.docx
- “打新定期跟踪”系列之二百零四:节后询价节奏逐步恢复,本周毓恬冠佳、汇通控股询价.docx
- “镜见”系列专题之四:提振“消费”的关键?.docx
- “无尽前沿”系列之一:AI革命,从“微观”到“宏观”的演进.docx
- “新质生产力”系列专题:并购重组赋能新质生产力.docx
- “学海拾珠”系列之二百二十四:ETF的资产配置与再平衡,样本协方差对比EWMA与GARCH模型.docx
- “重估牛”系列报告之十八:本轮科技重估行情与23年对比.docx
- 1月交易所及银行间托管数据点评:保险机构配债策略出现新变化.docx
- 2025年市总工会党组书记、市委组织部部长生活会“四个带头”个人对照检查发言材料2篇(含上年度整改+个人情况、个人事项+典型案例).docx
- 2025年部编版小学六年级下册《道德与法治》第四单元 让世界更美好第10课 我们爱和平教学课件.pptx
- 公司领导班子2025年围绕“四个带头”主题检视问题整改落实方案与组织生活会批评意见(20条)2篇文.docx
- 教育系统党组班子2025年对照“四个带头”含意识形态、以典型案例举一反三解析检视材料【2篇文】.docx
- 2025年国有企业领导班子、学校副校长生活会“四个带头”方面对照个人检视发言材料2篇文(附:上年度整改情况、典型案例解析).docx
- 2025年生活会“四个带头”个人对照检查材料2篇文(含对其他领导批评意见,个人公开事项申报、意识形态).docx
- 2025年国有企业党委书记、领导班子生活会“四个带头”方面对照检查发言材料2篇文(上年度整改情况).docx
- 乡镇领导班子、市委组织部常务副部长2025年对照“四个带头”含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 市委社会工作部2025年生活会领导班子对照检视发言材料2篇文(含以案为鉴,深刻反思存在问题、反面典型案例举一反三解析、其他需要说明情况).docx
- 2025年民主生活会、组织生活会批评意见(20条)与市直单位领导班子“四个带头”对照检查材料【含上年度查摆问题整改落实情况】2篇文.docx
文档评论(0)