- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数字经济“算力网络”系列13
文生视频模型Sora表现效果超预期,带动算力网络建
设需求
2月16日OpenAI推出文生视频模型Sora,可以根据文本指令创建现实且富有
想象力的场景,能够生成具有多个角色、特定类型的运动,以及主体和背景的
准确细节的复杂场景的高清视频,并且时长可以达到一分钟。Sora的超预期表
明Transformer模型在视觉领域的有效,为视觉模型的加速迭代奠定基础。
❑Sora模型展示效果惊艳,创立视觉模型里程碑。与之前的视觉模型不同,
OpenAI的Sora是视觉数据的通用模型,通过一次为模型提供多帧的预测,
解决了一个具有挑战性的问题,即确保主题即使暂时离开视野也保持不变。
它可以生成不同时长、长宽比和分辨率的视频和图像,而且最多可以输出长
达一分钟的高清视频。Sora的核心优势:一致性、灵活性、稳定性。Sora能
够灵活的生成各种像素各种画幅的图像,同时能够根据图像生成视频或者将
视频内容扩充出新的视频。与其他模型相比Sora生成的时长达到1分钟的情
况下还能保持前后主题的一致性是之前视觉模型所不具备的。同时Sora还涌
现出对物理规律的理解能力,在没有人为约束的情况下生成的画面中满足物
理学规则使得画面更加逼真。
❑视觉模型的GPT3时刻,模型迭代进入加速期。Sora之前,虽然大语言模型
随着GPT的成功逐渐成为主要研究方向,不过扩散模型仍在大语言模型占据
主导地位。DALL·E、StableDiffusion等广泛使用的视觉模型都采用扩散
模型。2023年谷歌提出大语言模型之所以在视频领域表现不佳的主要原因不
在于模型本身而在于没有好的表达形式来转化视频,也证明了大语言模型在
文生视频领域的可行性。Sora的突破之处在于基于DiT结构,结合了大语言
模型和扩散模型的共同优点。使得Diffusion模型也能够规模化,证明GTP4
式的大力出奇迹也能在视觉领域出现同样的“涌现”效果。Sora标志了扩散
+语言大模型融合路线的成功,未来具有很大的迭代潜力,类似于GPT3的里
程碑意义,沿着这条道路持续迭代未来1-2年内有望出现能生成效果更加逼
真的视觉模型。
❑Sora大幅拉动算力需求,拉动硬件建设投资。根据DiT模型创立者谢赛宁博
士粗略测算,Sora模型的参数规模大约为30亿。根据对可训练数据量的研
究成果,海外大型视频网站每分钟大约上传500小时视频内容。由此我们测
算训练Sora模型需要约7.09万张H100一个月的训练量。在推理侧,根据
相关研究测算生成一张图的算力消耗约为256个词的消耗。由此推算生成一
个1分钟时长短视频的算力消耗约是生成一次文字对话的千倍以上。中短期
算力将持续处于短缺不能充分满足推理侧需求。
❑投资建议:Sora打开AIGC在视觉领域的应用空间,算力网络供给持续短缺
拉动硬件基础设施建设需求。光模块环节我们重点推荐北美光模块核心供应
商:【中际旭创】/【新易盛】,及其上游核心供应商【天孚通信】,及国产
光芯片龙头【源杰科技】;交换机环节我们建议关注交换机国产替代龙头【紫
光股份】/【锐捷网络】,同时建议关注国产交换机芯片龙头【盛科通信】,
同时推荐国内ICT巨头【中兴通讯】;视频编解码环节我们建议关注视频编
解码优质公司【当虹科技】/【维海德】。
❑风险提示:核心计算参数假设不准确,Sora模型落地进度不及预期,行业竞
敬请阅读末页的重要说明
争格局恶化
重点公司主要财务指标
公司简称公司代码市值22EPS23EPS23PEPB投资评级
中兴通讯000063.SZ114.81.691.9912.11.7强烈推荐
紫光股份000938.SZ47.80.750.7921.21.4强烈推荐
中际旭创300308.SZ102.01.522.7446.37.5强烈推荐
天孚通信300394.SZ43.01.021.8459.214.9强烈推荐
盛科通信688702.SH13.1-0.07-0.09-370.6
文档评论(0)