- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
n技术路径:从GAN-Transformer-DiffusionModel-DiT,技术演进推动行业进入可商用阶段:20世纪90年代以来,AI视频生成持续迭代,经历了多个关键技术的突破,经历了从静态图像序列拼接成视频流-GAN-Transformer-DiffusionModel-DiT的技术演进,生成内容丰富度以及可控性持续提升。Sora验证了Diffusion和Transformer结合的有效性,并带动DiT架构逐渐成为当前重点方向。
n行业进入商业化发展快轨,根据FortuneBusinessInsights预计2032年全球规模突破184亿人民币。根据FortuneBusinessInsights测算,2024年AI视频生成全球规模为6.15亿美金,预计到2032年达到25.63亿美金,2025至2032年的复合增速为20%。AI视频生成产业规模受到价格以及模型能力的双重驱动。价格方面,目前国内外主流模型的API单秒价格在0.2-1元/秒,根据量子位智库测算,顶级动画电影制作成本约为十万元级/秒,本土动画电影制作成本在万元级/秒,本土TVC视频制作成本在千元级/秒,不论是对比广告视频或者影视剧/电影的单秒成本,AI视频生成均具有极大成本替代优势。另一方面模型能力持续突破,如时长方面Veo2支持理论最高2分钟的4K视频生成,可灵大师版可以通过续写方式将视频延长至3分钟。生成速度方面,以Seedance1.0为例,根据官方数据,对于5秒1080p分辨率的视频生成任务,实测推理耗时41.4秒(基于L20测试),效率大大提升。生成质量方面,现阶段AI生成视频常常需要“抽卡”,用户需反复尝试,才能生成相对理想结果,随着产品迭代,“抽卡率”有望降低。丰富度方面,声音内容陆续添加,如Veo3通过将视频像素转化为语义信号,实时生成匹配的视频声音,大大增强了视频生成可用性。下游应用来看,2B下游应用包括影视内容创作、商业广告、电商营销、城市文旅、动画教育、游戏娱乐等,应用场景多元化。2C方面,创意玩法持续拉近产品与C端用户距离,内容持续破圈。
n竞争格局方面,可灵等国产厂商表现突出。从模型表现来看,根据ArtificialAnalysis,Seedance1.0、Veo2/3、Kling2.0、Sora、MiniMax产品表现居前,国内模型水平达到全球领先水平。从商业化来看,根据TheInformation,Runway24年12月ARR达到8400万美金,25年底ARR冲??2.65亿美金;可灵2025年3月年化收入运行率突破1亿美金,4月及5月单月付费金额均突破1亿人民币,二者商业化表现突出。在使用量和访问量维度来看,Kling、Sora、Veo、Hailuo、PixVerse等表现居前。
n投资建议及相关标的。我们看好AI视频生成行业发展,产品可用性持续提升,商业化进入发展快轨。重点关注:快手(1024.HK)以及美图公司(1357.HK)(未覆盖)。
n风险提示:产品推广不及预期的风险;AI技术发展不及预期的风险;监管趋严的风险;算力瓶颈的风险;AI视频技术迭代不及预期的风险;商业化不及预期的风险;AI生成内容的版权风险
请务必阅读正文之后的免责条款部分;
2.AI视频生成行业:逐步进入可商用阶段,应用及商业化加速
3.投资建议及相关标的
4.风险提示;
n技术路径探索,从图像拼接生成-GAN-Transformer-DiffusionModel-DiT:相比于图片生成视频生成更为复杂,若按帧率24帧/秒,一条5秒的视频就百余张图像合成,同时视频生成还需要考虑时序连贯性、空间一致性等问题。20世纪90年代以来,AI视频生成持续迭代,经历了多个关键技术的突破,经历了从静态图像序列拼接成视频流-GAN-Transformer-DiffusionModel-
DiT的技术演进,生成内容丰富度以及可控性持续提升。
图:AI视频生成技术路径探索;
nVAE(VariationalAutoencoder变分自编码器)于2013年由Kingma和Welling提出,2015开始被应用于视频预测任务,通过编码器将输入数据映射到潜在空间,然后通过解码器从潜在空间生成数据。VAE生成视频内容存在模糊等问题。
nGAN(GenerativeAdversarialNetworks,对抗生成网络)于2014年由IanGoodfellow等人提出,2016年左右开始用于视频生成,主要由生成器(Generator)和判别器(Discriminator)两部分组成,生成器负责生成数据,判别器负责判断
您可能关注的文档
- “平台式、一体化与多策略”行动方案——中国机构配置手册公募基金专题.pptx
- AI+汽车智能化系列:深度剖析小米汽车核心竞争力.pptx
- AI算力系列之交换机:筑牢算力网络稳定核心,赋能AI产业高效前行.pptx
- AI系列专题报告:AIoT端侧发展态势剖析——智能硬件市场繁荣,国产SoC潜力凸显.pptx
- AI智能眼镜——AI技术商业化落地的创新载体与行业前瞻.pptx
- PCB行业——周期与成长双重驱动,AI时代推动行业格局升格.pptx
- Pharma全景洞察:业绩璀璨夺目,盈利拐点信号清晰释放.pptx
- 白酒板块策略:淡季价格承压态势显现,估值或已步入底部布局阶段.pptx
- 白酒及食品饮料行业策略:周期时钟论指引,行业步入新三大周期发展阶段.pptx
- 半导体材料系列报告:国际形势严峻背景下,国产半导体材料行业的破局发展路径.pptx
- 半导体策略:WSTS上修半导体销售额预测,ADI透露订单加速增长,把握行业积极信号下的投资机遇.pptx
- 储能板块策略:大型储能持续保持高景气度,工商业储能市场迎来爆发式增长.pptx
- 储能行业策略:平价时代下,深度聚焦工商储与美储的弹性增长潜力.pptx
文档评论(0)