- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
[Table_IndNameRptType]
互联网
行业点评
DeepSeek成本和性能双突破,有望加速国内AI
进程
行业评级:增持主要观点:
[Table_IndRank]
报告日期:2025-02-05[Table_Summary]
⚫DeepSeek取得AI模型性能和成本的双重突破
公司发布并开源了其最新的AI模型DeepSeek-R1。该模型在
[Table_Chart]
恒生指数与恒生科技指数走势比较
多个基准测试中表现出色,特别是在数学推理和编程任务上,达到
了与OpenAI的o1模型相当的性能水平。例如,在AIME2024数
学基准测试中,DeepSeek-R1的得分率为79.8%,略高于o1的
79.2%;在MATH-500基准测试中,DeepSeek-R1的得分率为
97.3%,也优于o1的96.4%。此外,DeepSeek发布了多模态开源
模型Janus-Pro,在GenEval和DPG-Bench基准测试中,击败了
StableDiffusion和OpenAI的DALL-E3;而阿里巴巴发布了
[Table_Author]Qwen2.5-Max,为超大规模MoE架构;OpenAI跟进,依次发布了
分析师:金荣
执业证书号:S0010521080002全新的推理模型o3-mini,为其推理模型首次免费,并在ChatGPT
邮箱:jinrong@上线DeepResearch,可在数十分钟完成人类专家需要几个小时的
复杂研究任务。
⚫DeepSeek主要通过训练流程设计和新算法应用取得创新
12月发布的DeepSeek-V3主要体现了高效架构与创新技术的
结合,包括1)MoE架构的共享专家策略,减少知识冗余,提高参
数效率;2)DeepSeek-V3引入了FP8混合精度训练框架,占用空
间更小,计算速度更快;3)多头潜在注意力(MLA)机制,模型的
表示空间得到扩展,复杂特征的学习能力提升,并行计算提高处理速
度;4)多Token预测(MTP)的应用,通过极致的内存和通讯管理,
部分克服了MTP的缺点,从整体上提高了大模型的训练效率;5)数
据并行和模型并行,显著提高了GPU利用率,同时减少了通信开
销;而从DeepSeek-V3到1月份的DeepSeek-R1,则在强化学习
您可能关注的文档
- 策略专题研究:没有“景气”的科技浪潮.pdf
- 传媒-DeepSeek带来的AI变革.pdf
- 计算机-DeepSeek惊艳世界,算力与应用将迎来结构性变化.pdf
- 计算机-一文读懂DeepSeek-大模型行业专题报告.pdf
- 全球货币变局研究一:“记账工具”:货币的进化历史.pdf
- 全球市场交易模式:黄金分析框架 20250127 -民银证券.pdf
- 人工智能-DeepSeek领衔,国产大模型竞争力加速迭代.pdf
- 人形机器人深度报告之六:从电动车复盘看机器人行情演绎:奇点已至,万亿空间.pdf
- 信息服务-兼具EQ和IQ的情感大模型.pdf
- 行业比较专题:DeepSeek策略三问.pdf
- (完整)国家公务员考试行测法律基础知识试题库及参考答案(通用版).pptx
- 2025年大学生心理健康知识竞赛题库及答案(共180题).pdf
- 山东省聊城市莘县2023-2024学年六年级下学期小升初考试数学试题.pdf
- 2025年中考数学总复习5年真题分类复习平行线和相交线、几何基础(解析版).pdf
- 2025年四川省成都市金牛区中考一诊英语试卷含详解.pdf
- 2024-2025学年上海市宝山区九年级上学期期末数学试卷(中考一模)含答案.pdf
- 2024-2025学年湖南省高二上学期12月月考物理试卷(B卷)含详解.pdf
- 2025年大学生入党积极分子培训考试试题170题及答案.pdf
- 2024年煤矿月安全工作总结报告.pdf
- 2024年山东省潍坊市高新区小升初数学试卷.pdf
文档评论(0)