AIGC视频生成时空一致性保障与首尾帧控制技术.docxVIP

  • 0
  • 0
  • 约4.97千字
  • 约 6页
  • 2026-07-03 发布于浙江
  • 举报

AIGC视频生成时空一致性保障与首尾帧控制技术.docx

AIGC视频生成时空一致性保障与首尾帧控制技术

摘要:AIGC视频生成面临的核心挑战是时空一致性问题——生成的视频帧之间常出现物体闪烁、形变漂移与背景抖动,且难以精确控制首尾帧的内容衔接。本文提出了一套“时空注意力引导+隐空间插值”的双引擎框架。在时空一致性保障方面,设计了3D因果卷积与时序移位注意力(TemporalShiftAttention)相结合的时空编码器,在潜空间中对相邻帧的隐变量施加平滑约束,抑制帧间突变。在首尾帧控制方面,提出了基于球面线性插值(SLERP)的隐空间轨迹规划方法——将首帧与尾帧的隐编码作为起点和终点,在潜空间中规划一条平滑的插值路径,确保视频从首帧自然过渡到尾帧。在开源数据集UCF-101与自定义的“物体旋转”测试集上进行了评测:时空一致性指标(FVD)从基线模型的142.3降至89.7,首尾帧控制准确率(人类评估者判断“首尾衔接自然”的比例)从52%提升至86%。在影视级镜头生成任务中,本技术成功生成了8秒、60帧的“花朵绽放”视频,首帧为花苞、尾帧为盛开花朵,中间过程自然流畅。本工作旨在为AIGC视频生成提供可靠的时空一致性保障与可控的首尾帧约束方法。

关键词:AIGC视频生成;时空一致性;首尾帧控制;隐空间插值;时序注意力

第一章绪论

AIGC(AIGeneratedContent)视频生成——利用扩散模型或自回归模型从文本描述或图像

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档