计算机行业市场前景及投资研究报告：多模态，AI大模型,Sora.pdf

下载文档

0
0
约5.68万字
约 27页
2024-02-27 发布于广东
举报
版权申诉
保障服务

计算机行业市场前景及投资研究报告：多模态，AI大模型,Sora.pdf

1、本文档共27页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

华福证券计算机

20240218

年月日

究研业行计算机强于大市（维持评级）

多模态，AI大模型新一轮革命一年内行业相对大盘走势

投资要点：

多模态推动人工智能迈向AGI，底层技术日臻成熟

相比单模态，多模态大模型同时处理文本、图片、音频以及视频

等多类信息，与现实世界融合度高，更符合人类接收、处理和表达信

息的方式，与人类交互方式更加灵活，表现的更加智能，能够执行更

大范围的任务，有望成为人类智能助手，推动AI迈向AGI。就技术架

告报题专业行构而言，多模态技术可拆解为编码、对齐、解码与微调等步骤，逐步

挖掘多模态关联信息，输出目标结果。文生图CLIP模型为最先成熟的

多模态技术，目前，多模态已不再局限于图文两层信息。例如，

Meta-Transformer可同时理解并处理12种模态信息。

OpenAI谷歌开启多模态军备竞赛，Sora和Gemini各领风骚

海外龙头具备先发与技术优势，引领多模态大模型前进方向：1）相关报告

OpenAI近期密集剧透GPT-5，相比GPT-4实现全面升级，重点突破语1、计算机行业当前处于什么周期位置？——

音输入和输入、图像输出以及最终的视频输入方向，或将实现真正多2024.02.05

2、AI应用大幕徐徐展开——2024.01.28

模态；此外，2月发布文生视频大模型Sora，能够根据文本指令或静3、计算机板块央国企控股公司梳理——

态图像生成1分钟的视频，其中包含精细复杂的场景、生动的角色表2024.01.25

情以及复杂的镜头运动，同时也接受现有视频扩展或填补缺失的帧，

能够很好地模拟和理解现实世界。2）Google推出原生多模态大模型

Gemini，可泛化并无缝地理解、操作和组合不同类别的信息；此外，2

月推出Gemini1.5Pro，使用MoE架构首破100万极限上下文纪录，

可单次处理包括1小时的视频、11小时的音频、超过3万行代码或超

过70万个单词的代码库。3）Meta坚持大模型开源，建设开源生态巩

华福证券

固优势，已陆续开源ImageBind、AnyMAL等多模态大模型。国内大

模型厂商有望沿着复制海外先进技术与发挥生态禀赋优势的两大路

径，与海外大厂逐步缩小差距。

多模态提升大模型泛化能力，垂直领域应用场景广阔

计算机行业市场前景及投资研究报告：多模态，AI大模型,Sora.pdf 原文免费试下载

您可能关注的文档

文档评论（0）

anhuixingxing + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

计算机行业市场前景及投资研究报告：多模态，AI大模型,Sora.pdf