20240403-国金证券-计算机行业深度研究:如何实现AGI,大模型现状及发展路径展望.pdfVIP

20240403-国金证券-计算机行业深度研究:如何实现AGI,大模型现状及发展路径展望.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

投资逻辑:

目前大模型能力仍处于EmergingAGI水平,就模型成熟度而言,语言大模型多模态大模型具身智能大模型。根据

DeepMind的定义,AGI应能够广泛学习、执行复杂多步骤的任务。模型的AGI水平可分为Level-0至Level-5共6

个等级,现阶段大模型在处理任务的广泛性上还有很大提升空间,即使是国际顶尖的大模型也仍处于Level-1

EmergingAGI阶段。不同类型大模型成熟度差异较大,目前大语言模型能力相对完善,落地应用场景丰富,底层技

术路线较为成熟;多模态大模型已经能够面向B\C端推出商业化产品,但细节优化空间较大;具身智能类大模型还在

探索阶段,技术路线尚不清晰。

现阶段讨论AGI能力提升仍需聚焦于多模态大模型的训练和应用。目前学界和业界重点关注ScalingLaw的有效性,

以及模型算法的可能改进方向。

ScalingLaw仍有深入空间。根据OpenAI研究,随模型参数量、数据集规模、训练使用的计算量增加,模型性

能能够稳步提高,即ScalingLaw。从训练样本效率、训练时长、各类资源对模型的贡献维度来看,目前Scaling

Law仍是提高模型性能的最优方法。OpenAI测算在模型参数量扩展到88万亿及之前,ScalingLaw依旧有效,

则中短期仍可延续此路线进行训练。

模型骨干网络架构尚未演变至终局,微调及稀疏结构成为提升模型性能的重要方法。目前主流大模型均采用

Transformer作为底层骨干网络,但针对编码器\解码器选择、多模态融合、自注意力机制等方面的探索仍在持续

推进。微调使用更小的数据量、更短的训练时间,让模型能够适应下游任务,以降低边际落地成本。以MoE为

代表的稀疏结构通过分割输入任务并匹配专家模型,能够提高模型的整体性能。

开源模型性能优化速度快于闭源模型。我们认为,目前第一梯队AI大模型纷纷进军万亿参数,且不远的将来大模型

将逐步逼近十万亿参数收敛值,对于本轮AI浪潮而言,找场景或优于做模型。在场景选择方面,对“幻觉”容忍度

高且能够替代人工的场景可实现应用率先落地,如聊天机器人、文本/图像/视频创作等领域;而对“幻觉”容忍度较

低的行业需要等待大模型能力提升或使用更多场景数据训练。

投资建议

算法、数据、算力是影响模型性能的关键因素,相关企业能够直接受益于大模型训练的持续推进,推荐国内AI算法

龙头科大讯飞等,建议关注数据工程供应商以及算力产业链相关公司。对于行业类公司而言,寻找通过AI赋能带来

效率提升的场景更为重要,建议关注AI+办公领域的金山办公、万兴科技,AI+安防领域的海康威视,AI+金融领域的

同花顺等公司。

风险提示

底层大模型迭代发展不及预期;国际关系风险;应用落地不及预期;行业竞争加剧风险。

敬请参阅最后一页特别声明1

扫码获取更多服务

行业深度研究

内容目录

1.距离AGI还有多远:语言大模型较为成熟,处于EmergingAGI水平4

2.如何实现AGI:ScalingLaw仍有深入空间,底层算法框架有待升级7

2.1ScalingLaw:中短期内,持续扩大参数量仍能改善模型表现9

2.2算法改进:骨干网络架构仍有创新空间,微调及稀疏结构能够提升性价比10

3.如何商业落地:借力模型开源及B端合作,寻找高人工替代率的场景17

3.1开源模型vs闭源模型?——ScalingLaw不再work之后,找场景或优于做模型17

3.2如何定义一个好场景?——“幻觉”尚未消除的世界,高人工替代率或为重点18

3.3如何处理“幻觉”?——ScalingLaw信仰派vs引入知识图谱改良派19

4.投资建议20

5.风险提示23

您可能关注的文档

文档评论(0)

如此醉 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档