细粒度可听描述及其基准研究.pdfVIP

  • 1
  • 0
  • 约16.93万字
  • 约 34页
  • 2026-04-17 发布于北京
  • 举报

细粒度可听描述

⋆2⋆1⋆322244531

,,周,,何博文,,,,,,,

1

12345

,OpenNLb,合肥工业大学,大学,大学

3

2

01.引言

2

r我们探索了一项新的视听语言建模任务,称为细语言是人类交流的主要形式,不仅为视觉和音频

a粒度可听描述(FAVD)。该任务旨在为给定的可等其他模态补充信息,还是一种高效的交流。

M

文档评论(0)

1亿VIP精品文档

相关文档