营销领域 AIGC 前沿进展与挑战-卫海天 .pdf

营销领域 AIGC 前沿进展与挑战-卫海天 .pdf

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

营销领域AIGC前沿进

展与挑战

卫海天

AIGC发展趋势

•LLM

•多模态

•大模型+插件

LLM技术发展

ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累。Transformer建模方法成熟

以后,使用一套统一的工具来开发各种模态的基础模型这种理念得以成熟,随后GPT-1、GPT-2、GPT-3模型持续演化升级,最终孵

化出ChatGPT文本对话应用。人工智能需要巨大的算力和数据投入,未来将形成大科技场提供基础AI能力,中小场围绕不同场景做

应用的生态竞争格局。

LLM技术发展技术原理

Transformer的模型架构出现使得模型性能大幅提升,chatgpt在transformer结构的基础上迭代升级成为引爆全球的AIGC模型。

LLM技术发展

研究人员发现模型扩展可以提高性能,他们进一步通过增加模型大小来研究扩展效果。有趣的是,当参数规模超过一定水平

时,这些放大的语言模型不仅实现了显著的性能改进,而且还展现了一些小规模语言模型(例如BERT)所没有的特殊能力

(例如上下文学习)

LLM技术发展

为了区分参数规模的差异,研究界为具有显著规模(例如包含数十亿或数百亿个参数)的PLMs创造了一个新术语——大型语言

模型LLM。近年来存在的大型语言模型(大小大于10B)时间线,黄色标记为开源的LLM

CV

AIGC技术:从有约束生成到逼真多样生成

图像与视频AI换脸

视频分析与自动剪辑

创意级图像、视频生成

二维图像三维化

图片-图片的风格迁移文本+图片-图片文本提示词-创意图片....

..

深度学习技术的升级迭代为计算机视觉发展奠定基础

2012年2014年2020年2022年

卷积神经网络(CNN)生成式对抗网络(GAN)VisionTransformer模型扩散模型(diffusion)

在图像分类任务上表现远超传统算生成模型和判别模型的互相博弈,在将NLP领域霸榜的模型引入视觉领域,实现模对数学本质的探索,带来深度学习新范

法,一战成名,开启深度学习时代欺骗与反欺骗中生成最佳的内容。型规模与计算精度的跨越式提升。式,成就引人惊叹的生成效果。

MLLM

尽管在处理自然语言场景中取得巨大的突破,但LLMs在处理图像和音频等多模态数据方面仍然存在困难。而在人类的日常生活

中,我们不仅仅通过语言进行交流,还会使用其他感官,如视觉、听觉和触觉等。且随着互联网的普及和各种传感器的广泛应

用,我们可以收集到大量的多模态数据,图像、音频、视频等数据的总量远远超过文本。同时现实中大量复杂问题的解决也必

然涉及到多个模态的交互,因此在LLMs之后,多模态大模型将

文档评论(0)

150****8957 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档