AIGC应用篇系列(二):国外AIGC各模态产品梳理.pdfVIP

  • 21
  • 0
  • 约1.24万字
  • 约 16页
  • 2024-04-26 发布于北京
  • 举报

AIGC应用篇系列(二):国外AIGC各模态产品梳理.pdf

证券研究报告

2023年4月16日

行业:传媒

增持

AIGC应用篇系列(二):国外AIGC各模态产品

梳理

分析师:陈旻SAC编号:S0870522020001

主要观点

我们AIGC系列专题《“大模型+小样本”快速适配下游场景,“AI+传媒”的效力取决于适配与迭代》将“AI+传媒”的研究框架

定义为“通用大模型”+“行业小样本”的技术架构。“AI+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用

的适配程度及迭代速度,更进一步理解:

1、“行业小样本”的数据集来自小模型或应用及内容:AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应

用及内容直接接入大模型或通过小模型接入大模型两种方式,即“大模型+应用及内容”或“大模型+小模型+应用或内容”,

其中具备特定功能的AIGC软件产品我们理解为“小模型”+“应用”的技术范式,本身具备较高质量的AI能力,若接入匹配的多

模态大模型,有望实现能力上的质变突破。

2、“行业小样本”的结合方式包括“能力调用”及“能力训练”两层:

(1)“能力调用”是指下游垂类场景直接调用通用大模型的通用能力,并基于垂类场景内产生的特性化数据不断提升调用能

力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力,此类方式可高效快速调用大

模型先进能力,在时间上及成本上具备优势。

(2)“能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练,从而形成垂类场景专属大模型。例如彭博

社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。我们认为未来拥有

丰富特性化数据集的下游垂类场景将主要采取此类方式,有助于构筑更强的能力壁垒。

围绕我们对“AI+传媒”的研究框架体系,我们后续分别针对“技术层”及“产品/应用层”梳理AIGC研究版图,本篇属于AIGC

系列专题中“AIGC应用篇系列之二”,重点梳理国外多模态头部应用产品,本篇主要整理国外图像、音频、视频类头部AIGC产

品。

2

主要观点

我们将国外主要AIGC头部产品按照文本、图像、音频、视频分类如下:

文本领域:AutomatedInsights(结构化写作)、Anyword、Copy.ai(数字广告文案)、Jasperai(营销文案AI)、ChatGPT(通用类聊

天机器人)、ChatBox(聊天客服机器人)、Jenni.ai(论文AI)

图像领域:Midjourney(2C端文生图AI)、DALL-E2、StableDiffusion(2B端开源高质量文生图模型)

音频领域:MurfAI(文本转语音生成器)、AIVA(歌曲生成)

视频领域:Synthesia(拼凑生成视频)、WonderStudio、RunwayGen-2(视频生成模型)

我们认为“通用大模型”+“行业小样本”是未来主流AI发展范式。我们理解AI大模型是一种新型平台模式,是移动互联网向沉浸互联网发展的中

间形态。从平台的逻辑出发,AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应用及内容直接接入大模型或通过小模型接入大模

型两种方式。我们认为国外头部AIGC应用产品属于“小模型”+“应用”的技术范式,本身具备较高质量的AI能力,若接入匹配的多模态大模型,

有望实现能力上的质变突破。一方面上层大模型持续为小模型、应用及内容赋予通用型能力,其兼容性取决于大模型的输出与小模型/应用及内容

的输入在模态上是否匹配;另一方面小模型、应用及内容持续产生的大数据可不断迭代大模型的通

文档评论(0)

1亿VIP精品文档

相关文档