2024 计算机行业专题：视频大模型奇点时刻加速到来.pptxVIP

下载本文档

0
0
约7.14千字
约 25页
2024-10-13 发布于四川
举报
版权申诉

2024 计算机行业专题：视频大模型奇点时刻加速到来.pptx

1、本文档共25页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

证券研究报告|行业专题

计算机行业投资评级|优于大市(维持)

2024年8月20日

视频大模型奇点时刻加速到来;

视频大模型迎来Sora时刻，生产力工具蓄势待发。自Sora发布以来，国内外已有十多家公司发布或更新视频生成模型。

√客观对比：与Sora差距缩小，抢占用户或为未来主线。国内外之间的差距正在逐步缩小，视频时长、分辨率等基础功能具有复

制性，未来竞争或向抢占用户、提升粘性等方向迁移，从而需要保障生成质量更高的可用视频，使得视频一致性更高、文本指令遵循更准确、物理真实模拟能力更强。

√主观对比：视频质量提升显著,离物理世界模拟器仍有距离。文生视频领域，视频画面普遍清晰，而在动作幅度与物理还原度

方面差异较大，我国Vidu、清影或已处于视频生成大模型第一梯队，生成时间相对其他模型倍数减少，且在动作幅度、物理还原度等复杂任务完成性较好；图生视频领域，整体效果优于文生视频，国内与国外差距进一步缩小。

√视频大模型具备商用潜力，下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善，视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。

算法、算力、数据三要素，视频大模型通往AGI的必经之路。

√算法：视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成，是效率与效益的比拼。前者模型更容易训练，而视频内容一致性要差一些，长视频训练存在困难；后者训练成本更高，但是生成视频的长度与一致性更容易得到保障。

√算力：以Sora为例，一定条件下测算，Sora训练算力需求是GPT-4的4.5倍，而推理算力需求接近GPT-4的400倍。√数据：高质量数据是模型能力的保障，而用户数量或为开启模型迭代“数据飞轮”的关键。

投资建议：建议关注(1)视频大模型厂商：科大讯飞、商汤、云从科技、格灵深瞳、拓尔思、昆仑万维等。(2)算力：海光

信息、寒武纪、景嘉微、中科曙光、浪潮信息、工业富联、神州数码、拓维信息、四川长虹等。(3)接入大模型的应用标的：金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等。;

视频的大模型迎来Sora时刻，

生产力工具蓄势待发

算法、算力、数据三要素，

视频大模型通往AGI的必经之路

投资建议

风险提示;

1.1国内外视频生成模型纷至沓来

1.2客观对比：与Sora差距缩小，抢占用户或为未来主线

1.4视频大模型具备商用潜力，下游应用正在储能;

根据APPSO微信公众号，自Sora发布以来，国内外已有不少于十家公司发布或更新视频生成模型。以7月为例：

√7月31日，Runway宣布Gen-3可支持图生视频。用户可以使用任何图片作为视频生成的首帧，上传的图片既可以单独使用，也可以使用文本提

示进行额外指导。

√7月26日，智谱AI版Sora清影发布，人人可用、半分钟快速创作视频的时代已来。清影理论上仅需30秒即可完成6秒1440×960清晰度高精度

视频的生成，展现出亮眼的推理速度，不仅具备高效的指令遵循能力，还具有内容的连贯性和调度灵活性。

√7月24日，爱诗科技将视频生成模型更新至PixVerseV2,支持一键生成至多5段连续的视频内容，且片段之间会自动保持主体形象、画面风

格和场景元素的一致性，视频效果再次提升。

√7月17日，英国AI创企HaiperAI宣布Haiper升级至v1.5,时长延长到8秒，且提供视频延长、画质增强等功能。

√7月6日，智象未来在WAIC上发布了智象大模型2.0,提供5、10、15秒三种视频生成时长，并增加文字嵌入生成、剧本多镜头视频生成、IP连

贯一致性等能力。此外，智象支持视频增强至4K画质。

图表：清影AI视频效果展示图表：PixVerseV2一次性生成多个一致性视频图表：智象大模型2.0可增强生成4K画质视频;

目前，国内外大模型在视频时长、分辨率、画面比例切换等功能或性能指标均与Sora缩小差距，在部分功能已有赶超。√生成类型：主流大模型大多具有文生视频、图生视频功能。国外Sora、Haiperv1.5同时具备视频生视频功能，而我

国清影视频生视频功能仅在demo中展示，尚未向用户开放。

√视频时长：在Sora鲶鱼带动下，主流大模型视频时长大都达到5-10s级别，我国部分大模型在时长上处于第一梯队。

例如，Vidu、PixverseV2、可灵、Vimi等模型可通过视频延展等方式达到30-120s,进一步缩小与Sora差距，甚至实

现赶超。

√分辨率：之前的产品分辨率大多在1024*576左右，目前

您可能关注的文档

文档评论（0）

gayl22 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

2024 计算机行业专题：视频大模型奇点时刻加速到来.pptxVIP