- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
证券研究报告·行业动态
DeepSeek核心十问十答
核心观点
DeepSeek-R1模型发布,具有高性能、低算力需求的特性,带动
小模型推理能力的提升,引发全球开发者及用户关注。R1作为开
源模型性能接近头部闭源模型o1,一定程度上已经反映了AI平
权,同时纯强化学习对推理能力的提升带来RL范式泛化可能,
预计后续基模的持续迭代,有望推动AI全产业链持续保持高景
气和高关注度,关注算力、应用、端侧、数据等核心投资机会。
行业动态信息
DeepSeek模型密集更新,高性能+低成本促进用户数高增
近期DeepSeek多款模型上线并完全开源,其中R1在推理任务上
基本实现于o1相当的性能,Janus-Pro在多模态理解和生成方面
表现较好。受春节信息传播下沉促进,DeepSeek出圈并成为全球
增速最快的AI原生应用,第18天达到1500万日活。此外,
DeepSeek通过算法迭代、架构升级,使通用及推理模型成本相较
于OpenAI同类模型下降至数十分之一以下。
技术不断革新,大模型ScalingLaw仍有效
DeepSeek通过多头潜在注意力、MoE、多token预测等架构和基
础设施创新实现了高效训练,并在R1-Zero模型验证了纯强化学
习对推理能力的提升。尽管Pre-TrainingScaling面临技术、算力、
数据的制约,但强化学习带来了规模化扩张新方向,预计各厂商
将陆续跟进,持续优化模型架构。
DeepSeek-R1促进AI平权,产业链享受发展红利
R1作为开源模型性能接近头部闭源模型o1,一定程度上已经反
映了AI平权。同时,R1使小模型具备推理能力成为可能,更低
的成本将更有利于开发者探索AI的实际落地。
投资建议:1)算力:算力建议关注以国产算力和AI推理需求
为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配
套产业,推荐海光信息、浪潮信息、软通动力,并关注AIDC
相关标的,如并行科技、宝信软件等;2)应用:B端推荐金蝶
国际、鼎捷数智、赛意信息、用友网络、恒生电子、中控技术
等;C端推荐金山办公、万兴科技、彩讯股份、同花顺等;3)端
侧:教育推荐视源股份、科大讯飞等;其次新终端推荐虹软科
技、联想集团等;4)数据:建议关注向量数据库、数据处理类
企业,以及具备行业侧专业数据的厂商,关注拓尔思等。
本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时
行业动态报告
目录
一、DeepSeek模型密集更新,高性能+低成本促进用户数高增1
1.1第一问:DeepSeek的用户量趋势?1
1.2第二问:R1和Janus-pro模型的性能如何?2
1.3第三问:如何看待DeepSeek-V3模型的训练成本?5
二、技术不断革新,大模型ScalingLaw仍有效7
2.1第四问:DeepSeek-V3/R1技术革新有哪些?7
2.2第五问:Janus系列模型技术革新有哪些?12
2.3第六问:DeepSeek数据集的特点是什么?13
2.3第七问:ScalingLaw到底是否有效?14
三、DeepSeek-R1促进AI平权,产业链享受发展红利16
3.1第八问:R1是否意味着AI平权已经实现?16
3.2第九问:DeepSeek出圈对产
文档评论(0)