sora+openai技术文档总结+中英对照原稿.docxVIP

  • 8
  • 0
  • 约1.63万字
  • 约 16页
  • 2024-02-29 发布于山西
  • 举报

sora+openai技术文档总结+中英对照原稿.docx

sora+openai技术文档总结+中英对照原稿

OPENAISORA技术报告原文+译文+报告总结

要点总结

模型路径:

1.架构为扩散模型(diffusionmodel)+transformer

2.训练时先用预训练模型把大量的大小不一的视频源文件编码转化为统一的patch表示,把时空要素提取作为transformer的token进行训练。

3.模型效果好和超大量的数据集和更多的运算时间息息相关

优势:

1.人物和背景的连贯性,即时人物运动出了相机范围再回来时还保持同样特征2.自然语言的理解程度很高

3.可以在同一个种子下生成不同尺寸(横向竖向)的视频适配不同设备

4.可以生成长达

文档评论(0)

1亿VIP精品文档

相关文档