AIGC应用篇系列(二)：国外AIGC各模态产品梳理.pdfVIP

下载本文档

21
0
约1.24万字
约 16页
2024-04-26 发布于北京
举报

AIGC应用篇系列(二)：国外AIGC各模态产品梳理.pdf

证券研究报告

2023年4月16日

行业：传媒

增持

AIGC应用篇系列（二）：国外AIGC各模态产品

梳理

分析师：陈旻SAC编号：S0870522020001

主要观点

我们AIGC系列专题《“大模型+小样本”快速适配下游场景，“AI+传媒”的效力取决于适配与迭代》将“AI+传媒”的研究框架

定义为“通用大模型”+“行业小样本”的技术架构。“AI+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用

的适配程度及迭代速度，更进一步理解：

1、“行业小样本”的数据集来自小模型或应用及内容：AI产业链包括上层大模型、中层小模型、下层应用及内容，包括应

用及内容直接接入大模型或通过小模型接入大模型两种方式，即“大模型+应用及内容”或“大模型+小模型+应用或内容”，

其中具备特定功能的AIGC软件产品我们理解为“小模型”+“应用”的技术范式，本身具备较高质量的AI能力，若接入匹配的多

模态大模型，有望实现能力上的质变突破。

2、“行业小样本”的结合方式包括“能力调用”及“能力训练”两层：

（1）“能力调用”是指下游垂类场景直接调用通用大模型的通用能力，并基于垂类场景内产生的特性化数据不断提升调用能

力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力，此类方式可高效快速调用大

模型先进能力，在时间上及成本上具备优势。

（2）“能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练，从而形成垂类场景专属大模型。例如彭博

社利用自身丰富的金融数据源，基于开源的GPT-3框架再训练，开发出了金融专属大模型BloombergGPT。我们认为未来拥有

丰富特性化数据集的下游垂类场景将主要采取此类方式，有助于构筑更强的能力壁垒。

围绕我们对“AI+传媒”的研究框架体系，我们后续分别针对“技术层”及“产品/应用层”梳理AIGC研究版图，本篇属于AIGC

系列专题中“AIGC应用篇系列之二”，重点梳理国外多模态头部应用产品，本篇主要整理国外图像、音频、视频类头部AIGC产

品。

主要观点

我们将国外主要AIGC头部产品按照文本、图像、音频、视频分类如下：

文本领域：AutomatedInsights（结构化写作）、Anyword、Copy.ai（数字广告文案）、Jasperai（营销文案AI）、ChatGPT（通用类聊

天机器人）、ChatBox（聊天客服机器人）、Jenni.ai（论文AI）

图像领域：Midjourney（2C端文生图AI）、DALL-E2、StableDiffusion（2B端开源高质量文生图模型）

音频领域：MurfAI（文本转语音生成器）、AIVA（歌曲生成）

视频领域：Synthesia（拼凑生成视频）、WonderStudio、RunwayGen-2（视频生成模型）

我们认为“通用大模型”+“行业小样本”是未来主流AI发展范式。我们理解AI大模型是一种新型平台模式，是移动互联网向沉浸互联网发展的中

间形态。从平台的逻辑出发，AI产业链包括上层大模型、中层小模型、下层应用及内容，包括应用及内容直接接入大模型或通过小模型接入大模

型两种方式。我们认为国外头部AIGC应用产品属于“小模型”+“应用”的技术范式，本身具备较高质量的AI能力，若接入匹配的多模态大模型，

有望实现能力上的质变突破。一方面上层大模型持续为小模型、应用及内容赋予通用型能力，其兼容性取决于大模型的输出与小模型/应用及内容

的输入在模态上是否匹配；另一方面小模型、应用及内容持续产生的大数据可不断迭代大模型的通

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

AIGC应用篇系列(二)：国外AIGC各模态产品梳理.pdfVIP