国产Sora类视频生成大模型陆续推出.pdf

国产Sora类视频生成大模型陆续推出.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

计算机设备

行业动态报告

目录

一、行业变化1

1.1极佳科技发布中国版Sora级视频生成大模型“视界一粟YiSu”1

1.2快手推出文生视频大模型“可灵”(Kling)2

1.3美图奇想大模型(MiracleVision)已升级到V54

二、持续关注标的5

三、行情回顾5

四、产业要闻9

五、重要公告11

六、风险提示……………………….13

请务必阅读正文之后的免责条款和声明。

计算机设备

行业动态报告

一、行业变化

1.1极佳科技发布中国版Sora级视频生成大模型“视界一粟YiSu”

6月6日,在奇绩创坛路演日上,世界模型公司极佳科技联合清华大学自动化系正式发布中国首个超长时

长、高性价比、端侧可用的Sora级视频生成大模型“视界一粟YiSu”。

“视界一粟YiSu”拥有模型原生的16秒超长时长,并可生成至1分钟以上;同时还拥有超大运动、超强

表现力、懂物理世界等众多优势;更重要的是,YiSu模型成本更低、速度更快、端侧可用;希望通过YiSu模

型强大的性能和极致的性价比,更快实现长视频生成的大规模产品应用。

技术路线方面,年初Sora的爆火,让DiT受到了业内极大的关注,很多公司和项目也开始复现DiT路

线。极佳科技和清华大学研究人员在视频生成技术路线上有着深入的积累和独特的理解,在autoregressive、

MaskedToken、DiT、UNet等不同路线方面均拥有丰富的经验。此前,团队提出WorldDreamer,是全球第一次

以Transformer和LLM(MaskedToken路线)为中心的视频生成工作。“视界一粟YiSu”基于团队自研的视

频生成大模型技术,并没有止步于DiT,而是融合LLM和扩散模型的自研架构,结合各种路线的优势,在多

模态融合、训练效率、推理效率、模型效果等方面达到极致的优化,打造视频生成的最佳方案。

图表1:“视界一粟YiSu”生成的视频截图

资料来源:Microsoft,中信建投

请务必阅读正文之后的免责条款和声明。

1

计算机设备

行业动态报告

世界模型在数据生成、闭环仿真、端到端方案等方面都具有重要的价值。YiSu也展示了基于视频生成的同款

架构,用于自动驾驶和机器人场景世界模型的效果。极佳科技在世界模型的技术和应用上都保持行业领先。2023

年9月,极佳科技推出了全球首个真实世界驱动的自动驾驶世界模型DriveDreamer,早于Wayve的GAIA-1;

2024年4月,极佳科技进一步更新了DriveDreamer-2,性能保持业内领先;2024年5月,极佳科技联合国内外

多家单位推出了全球首篇通用世界模型综述,该综述通过260余篇文献,对世界模型在视频生成、自动驾驶、

智能体、通用机器人等领域的研究和应用进行了详

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档