- 1
- 0
- 约16.93万字
- 约 34页
- 2026-04-17 发布于北京
- 举报
细粒度可听描述
⋆2⋆1⋆322244531
,,周,,何博文,,,,,,,
1
12345
,OpenNLb,合肥工业大学,大学,大学
3
2
01.引言
2
r我们探索了一项新的视听语言建模任务,称为细语言是人类交流的主要形式,不仅为视觉和音频
a粒度可听描述(FAVD)。该任务旨在为给定的可等其他模态补充信息,还是一种高效的交流。
M
细粒度可听描述
⋆2⋆1⋆322244531
,,周,,何博文,,,,,,,
1
12345
,OpenNLb,合肥工业大学,大学,大学
3
2
01.引言
2
r我们探索了一项新的视听语言建模任务,称为细语言是人类交流的主要形式,不仅为视觉和音频
a粒度可听描述(FAVD)。该任务旨在为给定的可等其他模态补充信息,还是一种高效的交流。
M
文档评论(0)