传媒行业国产AI视频:可用度强性价比高,快手可灵开启C端付费.docxVIP

传媒行业国产AI视频:可用度强性价比高,快手可灵开启C端付费.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

行业深度报告

前言:年初Sora、Pika、Runway等海外AI视频产品引领关注。但经过半年时间的追赶,国内一批AI视频产品,已经在可用度、性价比等方面赶超海外,如快手可灵、字节跳动即梦、智谱清影、Pixverse、Vidu、ChatPV等,虽视频效果仍有提升空间,但普通用户、创作者已经可以无门槛使用,并快速扩充短视频、中长视频平台的内容。

从视频效果看:整体效果相近,擅长公园、树木等大场景的生成,但细节表现均与Sora的demo视频略有差距,容易出现人物畸变、细节缺失。同时每个产品具备各自的特点,如快手可灵人物姿态较自然流畅,智

谱清影和爱诗科技PixVerse色彩较鲜明,生数科技Vidu的动作幅度大、运动速度较快,字节跳动即梦擅长动画风格,可以控制物体运动的速度。

从时长看:目前公开可用的产品,生成的视频时长主要在5-10s。其中智谱清影和生数科技Vidu生成速度快,仅需30s即可完成,国内外主流时间为5分钟左右。

图表1:主要国产AI视频产品梳理与对比

爱诗科技

生数科技

捷成股份

快手可灵 字节即梦 智谱清影

PixVerse

Vidu

ChatPV

功能 图生视频和文生视频

影视二创、数字人、文生视频等

视频时长 5s、10s 3-12s 6s

5s、8s,可以连续生成5个视频

4s、8s ——

等待时间 5分钟 约1分钟 30s 约10分钟 30s ——

商业化

商业化

以5s视频为

例,每日免费

以6s视频为例,

每日免费11条,

免费开放,高 推出免费版和标准

速通道权益5 个人用户免费版,后者去水印、 预计用于

6条,超出为 元/天或199 面向团队收费可商用,7.99美B端媒体机构超出约0.6元/条

1元/条 元/年 元/月

人物姿态自然动作幅度较大,且

人物姿态自然

动作幅度较大,且

效果 偏动画风格 色彩较鲜明 色彩较鲜明 ——流畅 表现流畅

资料来源:各公司官网,证券

一、为什么近期国产AI视频密集发布?

Sora验证DiT架构的可行性,国产模型经过半年时间追赶,整体效果已接近Sora。视频是用户消费时间最长的内容形式,据Questmobile,2017-2022年全球视频流量占互联网网络流量的比例已从73%上升至82%,

叠加视频制作时间长、成本高,因此AI视频一直以来都是AI发展的重要方向。23年已出现大量视频生成产品,效果较好的产品包括Pika、Runway等,但生成时长仅3-5秒、人物动作幅度较慢,难以满足日常的使用需求,上述两个产品于今年6月的网站访问量也自去年12月下滑20%左右。主要是因为过去视觉生成主要采用基于卷积神经网络U-Net的扩散模型,随着参数量的提升,此架构的效果提升会显著放缓甚至消失。2月初Sora验

行业深度报告

证了DiT架构在视频生成方面的可行性,驱动视频生成的质量和时长实现跃升,主要是因为基于Transformer架构的扩散模型展现出了更好的扩展性,有助于进一步提升模型的生成质量及效率。后续国内公司普遍沿用Sora

的技术路径,在DiT架构上进行微创新来研发视频生成模型。经过半年追赶,国内公司的产品陆续发布,整体

效果已接近Sora。我们从不同维度对比国产AI视频与Sora的效果:

视频尺寸——国产产品也能支持多种尺寸:Sora采用时空补片技术(Spacetimelatentpatches),将不同时长、宽高比和分辨率的视频、图片数据,转换为格式统一的时空补片后,再用于模型训练,使得Sora生成的

视频支持任意宽高比、分辨率和时长。国内主流产品中,快手可灵同样支持多种视频尺寸。

视频时长——国产产品最长突破2分钟,部分产品以推理速度快作为竞争优势。Sora支持生成60秒视

频,远高于同期Pika、Runway的3-5秒。可灵将视频时长拓展至2分钟(目前实际开放5s/10s两种规格),在国内产品中排名首位。部分产品虽然视频生成时长也在10秒以内,但其着重提高推理速度。目前主流产品生成5s视频大约需要5分钟,智谱清影和生数科技Vidu则将该时长缩短至30秒。

视频效果——国产产品整体接近Sora,细节处理略有差距:Sora物理性强,能创造出带有动态视角变化的视频,让人物和场景元素在三维空间中进行连续移动,并模拟出影响世界状态的简单行为。此后国产视频模型同样着眼于视频的动态性和物理性,但细节处理方面与Sora的demo视频仍有差

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档