MAGIC增强的关键词提示用于CLIP模型的零样
本音频字幕生成
VijayGovindarajan,PratikPatel,SahilTripathi,MdAzizulHoque,
andGau
您可能关注的文档
- 面向包容性的有毒内容审核:解决毒性分类器对抗攻击漏洞应对 LLM 生成的 内容.pdf
- OSU2MIR: 来自 OSU!的节拍追踪数据集.pdf
- 基于聊天的文本生成与交互在人物检索中的应用.pdf
- 通过不确定性估计减轻情绪支持对话中的策略偏好偏差.pdf
- PAC: 基于发音感知的上下文化大型语言模型的自动语音识别.pdf
- FINSENTLLM:多语言模型和结构化语义信号用于增强财务情绪预测.pdf
- 探索单图像反射去除的光谱特性.pdf
- ECG-ABCDE:克服模型依赖性,将 ECG 编码成适用于任何 LLM 的通用语言.pdf
- PerchMobi3:一种具有能量复用四风扇机制的多模态机器人, 适用于空地壁移动.pdf
- GBV-SQL: 引导生成和 SQL2Text 回译验证 用于多代理文本到 SQL 转换.pdf
原创力文档

文档评论(0)