2024AIGC视频生成行业:走向AI创生时代,视频生成的技术演进、范式重塑与商业化路径探索.docxVIP

2024AIGC视频生成行业:走向AI创生时代,视频生成的技术演进、范式重塑与商业化路径探索.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

A1

A1GC

视频生成的技术演进、范式重塑与商业化路径探索

出品机构:甲子光年智库

研究团队:张一甲、宋涛

发布时间:2024.03

*刘瑶、小麦对本报告亦有贡献。

“一类人有一类人原力觉醒的方式。

物理学家想学习上帝;

数学家想反抗上帝;

哲学家认为自己就是上帝;

生物学家想造上帝的反……

工程师说都不用,我们再造一个。”

——《甲小姐:站在两个世界之间》甲子光年2017.10

Part01AIGC视频生成的技术路线与产品演进趋势

Part01AIGC视频生成的技术路线与产品演进趋势

目录

Part02AIGC视频生成推动世界走向“AI创生时代”

Part03

Part03“提示交互式”视频制作范式重塑视频产业链

Part04

Part04文娱领域有望开启第二轮投资浪潮

“炸裂”视频效果成为讨论热点效果逼真:普通人一时难以分辨时长感人:60秒高清视频生成1.1Sora让文生视频迎来“GPT-3”时刻

“炸裂”视频效果成为讨论热点

效果逼真:普通人一时难以分辨

时长感人:60秒高清视频生成

OpenAI发布文生视频模型Sora,堪称视频生成领域的“GPT-3”时刻

春节假期甚至还未结束,

春节假期甚至还未结束,Sora已引发全民关注

“Sora”一词在微信指数及百度指数的关注度快速上升

2月16日微信指数快速上升

2月16日微信指数快速上升

百度关键词搜索趋势处于高位

百度关键词搜索趋势处于高位

“百万”剪辑:堪比专业的镜头语言

“百万”剪辑:堪比专业的镜头语言

多模态:文字、图片、视频皆可生成视频

多模态:文字、图片、视频皆可生成视频

其他模型情况W.A.L.T开发团队RunwayPikaLabsStablityAIMeta时间2023年11月2023年11月2023年11月2023年11月2023年12月长度4-18秒3-7秒2-4秒4秒3秒分辨率768*448,1536*896,40967202560*1440576*1024512*512512*896是否开源非开源非开源开源非开源非开源Sora的语言理解能力更强,可将简短的用户提示转换为更长的详细描述Sora还可以生成图片,最高可达到2048*2048分辨率Sora通过插帧技术,实现完全不同主题和场景构图的视频之间的流畅自然的过渡效果Sora可生成具有动态摄像机运动效果的视频,随着摄像机的移动和旋转,人和场景元素在三维空间中保持一致移动Sora可以对短期和长期依赖关系进行建模,保持各个主体的时空连贯性和一致性Sora以简单的方式模拟影响世界状态的行为,比如一个人吃完汉堡可以在上面留下咬痕Sora还能够模拟人工过程,比如视频游戏,同时通过基本策略控制玩家,同时以高保真度渲染世界及其动态

其他

模型

情况

W.A.L.T

开发团队

RunwayPikaLabs

StablityAI

Meta

时间

2023年11月2023年11月

2023年11月

2023年11月

2023年12月

长度

4-18秒3-7秒

2-4秒

4秒

3秒

分辨率

768*448,1536*896,4096*2160

1280*7202560*1440

576*1024

512*512

512*896

是否开源

非开源非开源

开源

非开源

非开源

Sora的语言理解能力更强,可将简短的用户提示转换为更长的详细描述

Sora还可以生成图片,最高可达到2048*2048分辨率

Sora通过插帧技术,实现完全不同主题和场景构图的视频之间的流畅自然的过渡效果

Sora可生成具有动态摄像机运动效果的视频,随着摄像机的移动和旋转,人和场景元素在三维空间中保持一致移动

Sora可以对短期和长期依赖关系进行建模,保持各个主体的时空连贯性和一致性

Sora以简单的方式模拟影响世界状态的行为,比如一个人吃完汉堡可以在上面留下咬痕

Sora还能够模拟人工过程,比如视频游戏,同时通过基本策略控制玩家,同时以高保真度渲染世界及其动态

模型

StableVideoDiffusion

EmuVideo

Gen-2pika1.0

李飞飞及其学生团队、谷歌

Sora模型展现自身超强视频生成及剪辑能力,超出其他竞品一个段

文档评论(0)

186****0576 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5013000222000100

1亿VIP精品文档

相关文档