AutoAD:利用预训练模型生成高质量电影音频描述.pdfVIP

  • 0
  • 0
  • 约17.65万字
  • 约 38页
  • 2026-05-12 发布于北京
  • 举报

AutoAD:利用预训练模型生成高质量电影音频描述.pdf

AutoAD:情境描述

1∗1∗1†1,21,31

¨1

韩腾达·贝恩阿尔沙·纳格尼G尔·瓦罗尔安德鲁·齐瑟曼牛津大学视觉几

2´3

何组LIGM,巴黎高科桥路学校,古斯塔夫·埃菲尔大学,CNRS交通大学计算医学影像

3

2

0

2

r本文的目标是构建一个自动音频描述(AD)模型,

a

M该模型可以输入并输出文本形式的音频描述。生成

高质量的音频描述具有性,因为描述依赖于上上下文:字幕:

9下文,并且可用的训练数据有限。在这项工作中,我们当凯伦阴沉着脸望着窗外时,我能请你喝一杯吗?

2

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档