网站大量收购独家精品文档,联系QQ:2885784924

计算机行业市场前景及投资研究报告:大模型研究框架.pdfVIP

计算机行业市场前景及投资研究报告:大模型研究框架.pdf

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

证券研究报告

计算机

2025年04月20日

计算机行业深度:大模型研究框架(2025)

——“大模型”系列(5)

最近一年走势相关报告

《计算机“人工智能”系列专题:AutoGLM沉思:

62%计算机沪深300DeepResearch+Operator,开启智能体新阶段(推荐)*计算机*刘熹》——

2025-04-17

45%《计算机行业深度报告:关税对自主可控的影响拆解——计算机“自主可控”

系列报告(3)(推荐)*计算机*刘熹》——2025-04-11

27%《服务器电源:AI芯片功耗提升,高功率电源景气上行——AI算力“卖水人”

系列(五)(推荐)*计算机*刘熹》——2025-03-10

10%

-8%

-25%

2024/04/152024/06/152024/08/152024/10/152024/12/152025/02/152025/04/15

相对沪深300表现

表现1M3M12M

计算机-17.7%3.6%26.0%

沪深300-5.9%-1.0%5.7%

2

核心提要

u大模型发展回顾:以Transformer为基,Scalinglaw贯穿始终

2017年谷歌团队提出Transformer架构,创造性推动注意力层以及前馈神经网络层的发展,加速提升模型性能。2018–2020年是预训练Transformer

模型时代,GPT-3以1750亿参数突破大规模预训练的可能性界限,而SFT及RLHF等技术帮助模型加速对齐人类价值观。此后随着训练侧ScalingLaw

描述的幂律关系出现收益递减,叠加高质量文本数据或逐步被AI耗尽,推理模型开始进入人们视野;以OpenAI发布o1-preview将AIME2024的模型

回答准确率从GPT4o的13.4%提升至56.7%,模型维持加速迭代更新。

u国内大模型进展:行业充分竞争,降本提效为主旋律

资源有限的条件下,预计低成本高性能追平海外SOTA为2025年国产大模型的主题。我们以DeepSeek、豆包、阿里千问为例,1)DeepSeek-

R1/V3依靠创新的降本提效手段,核心旨在资源有限的条件下,极大提升GPU在计算/通信上的利用率。2)豆包大模型在2024年下半年发力,月活数

据冲上全球第二和国内第一;同样在降本增效范式上依靠稀疏MoE架构实现小参数高性能;3)阿里Qwen引领国产开源模型标杆的同时,依靠强化

学习范式推出的QwQ-32B已登顶全球最强开

您可能关注的文档

文档评论(0)

anhuixingxing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档