- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
证券研究报告|行业专题
计算机行业投资评级|优于大市(维持)
2024年8月20日
视频大模型奇点时刻加速到来;
视频大模型迎来Sora时刻,生产力工具蓄势待发。自Sora发布以来,国内外已有十多家公司发布或更新视频生成模型。
√客观对比:与Sora差距缩小,抢占用户或为未来主线。国内外之间的差距正在逐步缩小,视频时长、分辨率等基础功能具有复
制性,未来竞争或向抢占用户、提升粘性等方向迁移,从而需要保障生成质量更高的可用视频,使得视频一致性更高、文本指令遵循更准确、物理真实模拟能力更强。
√主观对比:视频质量提升显著,离物理世界模拟器仍有距离。文生视频领域,视频画面普遍清晰,而在动作幅度与物理还原度
方面差异较大,我国Vidu、清影或已处于视频生成大模型第一梯队,生成时间相对其他模型倍数减少,且在动作幅度、物理还原度等复杂任务完成性较好;图生视频领域,整体效果优于文生视频,国内与国外差距进一步缩小。
√视频大模型具备商用潜力,下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善,视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。
算法、算力、数据三要素,视频大模型通往AGI的必经之路。
√算法:视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成,是效率与效益的比拼。前者模型更容易训练,而视频内容一致性要差一些,长视频训练存在困难;后者训练成本更高,但是生成视频的长度与一致性更容易得到保障。
√算力:以Sora为例,一定条件下测算,Sora训练算力需求是GPT-4的4.5倍,而推理算力需求接近GPT-4的400倍。√数据:高质量数据是模型能力的保障,而用户数量或为开启模型迭代“数据飞轮”的关键。
投资建议:建议关注(1)视频大模型厂商:科大讯飞、商汤、云从科技、格灵深瞳、拓尔思、昆仑万维等。(2)算力:海光
信息、寒武纪、景嘉微、中科曙光、浪潮信息、工业富联、神州数码、拓维信息、四川长虹等。(3)接入大模型的应用标的:金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等。;
视频的大模型迎来Sora时刻,
生产力工具蓄势待发
算法、算力、数据三要素,
视频大模型通往AGI的必经之路
投资建议
风险提示;
1.1国内外视频生成模型纷至沓来
1.2客观对比:与Sora差距缩小,抢占用户或为未来主线
1.4视频大模型具备商用潜力,下游应用正在储能;
根据APPSO微信公众号,自Sora发布以来,国内外已有不少于十家公司发布或更新视频生成模型。以7月为例:
√7月31日,Runway宣布Gen-3可支持图生视频。用户可以使用任何图片作为视频生成的首帧,上传的图片既可以单独使用,也可以使用文本提
示进行额外指导。
√7月26日,智谱AI版Sora清影发布,人人可用、半分钟快速创作视频的时代已来。清影理论上仅需30秒即可完成6秒1440×960清晰度高精度
视频的生成,展现出亮眼的推理速度,不仅具备高效的指令遵循能力,还具有内容的连贯性和调度灵活性。
√7月24日,爱诗科技将视频生成模型更新至PixVerseV2,支持一键生成至多5段连续的视频内容,且片段之间会自动保持主体形象、画面风
格和场景元素的一致性,视频效果再次提升。
√7月17日,英国AI创企HaiperAI宣布Haiper升级至v1.5,时长延长到8秒,且提供视频延长、画质增强等功能。
√7月6日,智象未来在WAIC上发布了智象大模型2.0,提供5、10、15秒三种视频生成时长,并增加文字嵌入生成、剧本多镜头视频生成、IP连
贯一致性等能力。此外,智象支持视频增强至4K画质。
图表:清影AI视频效果展示图表:PixVerseV2一次性生成多个一致性视频图表:智象大模型2.0可增强生成4K画质视频;
目前,国内外大模型在视频时长、分辨率、画面比例切换等功能或性能指标均与Sora缩小差距,在部分功能已有赶超。√生成类型:主流大模型大多具有文生视频、图生视频功能。国外Sora、Haiperv1.5同时具备视频生视频功能,而我
国清影视频生视频功能仅在demo中展示,尚未向用户开放。
√视频时长:在Sora鲶鱼带动下,主流大模型视频时长大都达到5-10s级别,我国部分大模型在时长上处于第一梯队。
例如,Vidu、PixverseV2、可灵、Vimi等模型可通过视频延展等方式达到30-120s,进一步缩小与Sora差距,甚至实
现赶超。
√分辨率:之前的产品分辨率大多在1024*576左右,目前
文档评论(0)