生成式AI行业市场分析.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生成式AI行业市场分析

1、生成式A1在视频/3D/游戏等领域的渗透加速

生成算法模型不断突破创新,下游应用场景不断拓展

基础的生成算法模型不断突破创新,基础能力日新月异,从图像向视

频和3D扩展,更广泛地应用于下游应用场景。生成对抗网络GAN)

是早期最著名的生成模型之一,尽管在图像生成上产生了卓越的效果,

但其训练常常受到梯度消失和模式崩溃等问题的影响。与GAN相比,

扩散模型(DiffusionMode1)只需要训练“生成器”,不需要训练别的

网络(判别器、后验分布等),训练时仅需模仿一个简单的前向过程对

应的逆过程,实现简练过程的简化。扩散模型相对GAN来说具有更灵

活的模型架构和更精确的对数似然计算,生成图像质量明显优于GAN,

已经成为目前最先进的图像生成模型。

此前扩散模型主要适用于生成2D图像,23年Runway的最新研究成

果将扩散模型扩展到视频领域,在未加字幕的视频和配对的文本-图像

数据的大规模数据集上训练出视频扩散模型。NeRF(神经辐射场)的

出现为3D场景生成带来了新的可能性,进一步拓宽生成算法领域下

游的应用场景。NeRF(NeuraIRadianceFieId)是一种基于神经网络的

3D重建技术,不同于传统的三维重建方法把场景表示为点云、网格、

体素等显式的表达,NeRF将场景建模成一个连续的5D辐射场隐式存

储在神经网络中,输入多角度的2D图像,通过训练得到神经辐射场模

型,根据模型渲染出任意视角下的清晰照片。

Runway:生成式A1内容平台,Gen∙1可实现用文字和图像从现有

视频中生成新视频

RUnWay是一家生成式A1内容平台,致力于让所有人都能进行内容

创作。RUnWay创立于2018年,总部位于纽约,提供图片、视频领域

的生成式A1服务。Runway得到众多资本青睐,获得谷歌领投的D轮

融资。创立以来,Runway已获得Fe1icisCoatueAmP1ify、1UX、

Compound等顶级投资机构投资。23年6月,Runway获得由谷歌领

投的1亿美元的D轮融资,这笔融资交易包括三年内7500万美元的

谷歌云积分和其他服务,估值达到15亿美元。

主要产品为Gen-1和Gen-2,Gen-1可实现用文字和图像从现有视频

中生成新视频,Gen∙2可实现文字生成视频功能。Gen-1:不需要灯

光、相机和动捕,通过将图像或文本提示的结构和风格应用于源视频

的结构,逼真且一致地合成新视频,且具有表现力、电影感和一致性。

Gen-1提供给用户五种不同的视频制作模式:1)Sty1iZatiOn:将任何图

像或提示的风格转移到视频的每一帧;2)Storyboard:将模型变成完

全风格化和动画的渲染。3)Mask:隔离视频中的主题并使用简单的文

本提示对其进行修改;4)Render:通过应用输入图像或提示,将无纹

理渲染变成逼真的输出;5)Customization:通过自定义模型以获得更

高保真度的结果,释放Gen-1的全部功能。Gen-1的性能优势:基于

用户研究,GEN-1的结果优于现有的图像到图像和视频到视频的转换

方法,比StabIeDiffUSiOn1.5提升73.83%,比Text21ive提升88.24%

o

Gen∙2是一个多

文档评论(0)

135****5548 + 关注
官方认证
内容提供者

各类考试卷、真题卷

认证主体社旗县兴中文具店(个体工商户)
IP属地河南
统一社会信用代码/组织机构代码
92411327MAD627N96D

1亿VIP精品文档

相关文档