- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
行业深度报告
前言:年初Sora、Pika、Runway等海外AI视频产品引领关注。但经过半年时间的追赶,国内一批AI视频产品,已经在可用度、性价比等方面赶超海外,如快手可灵、字节跳动即梦、智谱清影、Pixverse、Vidu、ChatPV等,虽视频效果仍有提升空间,但普通用户、创作者已经可以无门槛使用,并快速扩充短视频、中长视频平台的内容。
从视频效果看:整体效果相近,擅长公园、树木等大场景的生成,但细节表现均与Sora的demo视频略有差距,容易出现人物畸变、细节缺失。同时每个产品具备各自的特点,如快手可灵人物姿态较自然流畅,智
谱清影和爱诗科技PixVerse色彩较鲜明,生数科技Vidu的动作幅度大、运动速度较快,字节跳动即梦擅长动画风格,可以控制物体运动的速度。
从时长看:目前公开可用的产品,生成的视频时长主要在5-10s。其中智谱清影和生数科技Vidu生成速度快,仅需30s即可完成,国内外主流时间为5分钟左右。
图表1:主要国产AI视频产品梳理与对比
爱诗科技
生数科技
捷成股份
快手可灵 字节即梦 智谱清影
PixVerse
Vidu
ChatPV
功能 图生视频和文生视频
影视二创、数字人、文生视频等
视频时长 5s、10s 3-12s 6s
5s、8s,可以连续生成5个视频
4s、8s ——
等待时间 5分钟 约1分钟 30s 约10分钟 30s ——
商业化
商业化
以5s视频为
例,每日免费
以6s视频为例,
每日免费11条,
免费开放,高 推出免费版和标准
速通道权益5 个人用户免费版,后者去水印、 预计用于
6条,超出为 元/天或199 面向团队收费可商用,7.99美B端媒体机构超出约0.6元/条
1元/条 元/年 元/月
人物姿态自然动作幅度较大,且
人物姿态自然
动作幅度较大,且
效果 偏动画风格 色彩较鲜明 色彩较鲜明 ——流畅 表现流畅
资料来源:各公司官网,证券
一、为什么近期国产AI视频密集发布?
Sora验证DiT架构的可行性,国产模型经过半年时间追赶,整体效果已接近Sora。视频是用户消费时间最长的内容形式,据Questmobile,2017-2022年全球视频流量占互联网网络流量的比例已从73%上升至82%,
叠加视频制作时间长、成本高,因此AI视频一直以来都是AI发展的重要方向。23年已出现大量视频生成产品,效果较好的产品包括Pika、Runway等,但生成时长仅3-5秒、人物动作幅度较慢,难以满足日常的使用需求,上述两个产品于今年6月的网站访问量也自去年12月下滑20%左右。主要是因为过去视觉生成主要采用基于卷积神经网络U-Net的扩散模型,随着参数量的提升,此架构的效果提升会显著放缓甚至消失。2月初Sora验
行业深度报告
证了DiT架构在视频生成方面的可行性,驱动视频生成的质量和时长实现跃升,主要是因为基于Transformer架构的扩散模型展现出了更好的扩展性,有助于进一步提升模型的生成质量及效率。后续国内公司普遍沿用Sora
的技术路径,在DiT架构上进行微创新来研发视频生成模型。经过半年追赶,国内公司的产品陆续发布,整体
效果已接近Sora。我们从不同维度对比国产AI视频与Sora的效果:
视频尺寸——国产产品也能支持多种尺寸:Sora采用时空补片技术(Spacetimelatentpatches),将不同时长、宽高比和分辨率的视频、图片数据,转换为格式统一的时空补片后,再用于模型训练,使得Sora生成的
视频支持任意宽高比、分辨率和时长。国内主流产品中,快手可灵同样支持多种视频尺寸。
视频时长——国产产品最长突破2分钟,部分产品以推理速度快作为竞争优势。Sora支持生成60秒视
频,远高于同期Pika、Runway的3-5秒。可灵将视频时长拓展至2分钟(目前实际开放5s/10s两种规格),在国内产品中排名首位。部分产品虽然视频生成时长也在10秒以内,但其着重提高推理速度。目前主流产品生成5s视频大约需要5分钟,智谱清影和生数科技Vidu则将该时长缩短至30秒。
视频效果——国产产品整体接近Sora,细节处理略有差距:Sora物理性强,能创造出带有动态视角变化的视频,让人物和场景元素在三维空间中进行连续移动,并模拟出影响世界状态的简单行为。此后国产视频模型同样着眼于视频的动态性和物理性,但细节处理方面与Sora的demo视频仍有差
您可能关注的文档
- 北交所科技新产业跟踪第二十八期:海内外高密度智算中心建设“紧锣密鼓”,北交所智能算力产业链盘点.docx
- 北汽蓝谷公司深度报告:深度系列(二),享界-有望成为轿车中的M9.docx
- 北新建材央企资质%2b优质管理巩固石膏板核心优势,两翼业务加速布局.docx
- 奔朗新材(836807)首次覆盖报告:超硬材料制品龙头,业务布局持续优化.docx
- 博纳影业公司研究报告:24H2起重点影视内容发力,积极AI、短剧、版权新方向布局.docx
- 博瑞医药(688166)深度报告:原料药制剂一体化龙头,双靶点GLP1GIP新药极具潜力.docx
- 博众精工(688097)3C自动化龙头,受益果链创新周期.docx
- 财富与资管行业洞察报告2024H1:以投资者为中心的降本增收.docx
- 财政政策专题研究系列之十五:财政政策的增长和价格效应.docx
- 沧州大化首次覆盖报告:旧貌换新颜,TDI和PC两大核心产品再突破.docx
最近下载
- 第二单元+缤纷舞曲——夏夜圆舞曲+课件+2024—2025学年人音版(简谱)(2024)初中音乐七年级上册.pptx VIP
- 100例小学数学图形中阴影部分的面积附答案.docx
- 一种中药材超声波提取装置.pdf VIP
- 少先队入队前六知六会一做.docx VIP
- 《工业机器人》完整版练习试题附答案.doc
- 线路工程项目管理实施细则.docx VIP
- 统编版高中政治必修2经济与社会第一单元生产资料所有制与经济体制测试卷(含答案解析).pdf VIP
- 人教pep六年级上册unit3My-weekend-plan7-单元整体作业设计.docx VIP
- 超星学习通网课《光影中国》尔雅答案2023题目及答案.docx
- 精品解析:2021-2022学年广东省深圳市罗湖区北师大版六年级上册期中测试数学试卷(原卷版).docx VIP
文档评论(0)