- 8
- 0
- 约1.63万字
- 约 16页
- 2024-02-29 发布于山西
- 举报
sora+openai技术文档总结+中英对照原稿
OPENAISORA技术报告原文+译文+报告总结
要点总结
模型路径:
1.架构为扩散模型(diffusionmodel)+transformer
2.训练时先用预训练模型把大量的大小不一的视频源文件编码转化为统一的patch表示,把时空要素提取作为transformer的token进行训练。
3.模型效果好和超大量的数据集和更多的运算时间息息相关
优势:
1.人物和背景的连贯性,即时人物运动出了相机范围再回来时还保持同样特征2.自然语言的理解程度很高
3.可以在同一个种子下生成不同尺寸(横向竖向)的视频适配不同设备
4.可以生成长达
您可能关注的文档
- 《智慧城市 城市数字孪生 第1部分:技术参考架构》征求意见稿.docx
- 2023年中国云原生安全用户调查报告.docx
- 2024年1月服饰行业市场月报.docx
- 2024年1月美妆行业市场报告.docx
- 2024年1月食饮行业市场报告.docx
- AppAgent 能够操作任何手机App的Agent模型.docx
- DLT5717-2015农村住宅电气工程技术规范.docx
- IAB:2023年零售媒体买家指南 Retail Media Buyer’s Guide.docx
- KPMG -2024年银行业风险雷达图 -2024年中国银行业重点风险雷达图及中国银行业重点风险清单.docx
- Nat. Rev. Phys.综述:复杂网络的鲁棒性和韧性.docx
最近下载
- 临床试验质量管理方案.docx VIP
- 广西壮族自治区环境监测收费标准wwwglpricecn.doc VIP
- 宣贯培训(2026年)《GBT 14711-2013中小型旋转电机通用安全要求》.pptx VIP
- 课件:办公室英语——接电话&打电话.ppt VIP
- DuPont塑胶介绍..ppt VIP
- a320-afm-飞行手册中文版-南航.doc VIP
- 八大安全作业票(新规 )(GB 30871-2022) .pdf VIP
- 煤矿单轨吊轨道内力计算及选型.pdf VIP
- 万泰电子-BPJ系列变频器说明书V1.0_20131226.pdf VIP
- HUAMEI华魅电吹管AC966 92312345用户手册.pdf
原创力文档

文档评论(0)