CN119583907A 一种场景变化可控的文生视频方法、系统和设备 (清华大学).docxVIP

  • 1
  • 0
  • 约2.33万字
  • 约 35页
  • 2026-05-19 发布于山西
  • 举报

CN119583907A 一种场景变化可控的文生视频方法、系统和设备 (清华大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119583907A

(43)申请公布日2025.03.07

(21)申请号202411842004.4

(22)申请日2024.12.13

(71)申请人清华大学

地址100084北京市海淀区双清路30号

(72)发明人朱文武王鑫张一彭

(74)专利代理机构北京润泽恒知识产权代理有限公司11319

专利代理师苟冬梅

(51)Int.Cl.

H04N21/81(2011.01)

H04N21/854(2011.01)

H04N21/44(2011.01)

H04N21/458(2011.01)

H04N21/466(2011.01)

权利要求书3页说明书13页附图3页

(54)发明名称

一种场景变化可控的文生视频方法、系统和

设备

(57)摘要

CN119583907A本申请提供了一种场景变化可控的文生视频方法、系统和设备,涉及计算机技术领域,该方法包括:将用于描述文本输入基于空间布局融合器的视频生成器,生成视频片段,视频生成器是在U型网络每层的交叉注意力模块的开头添加空间布局融合器后得到的,空间布局融合器为文本到图像生成模型;描述文本至少包括:运动主体和运动主体从第一场景移动至第二场景的运动轨迹;通过跨片段调度机制模块,将视频生成器生成的前

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档