通过视觉语言预训练实现医学图像和文本的多模态理解与生成.pdfVIP

  • 0
  • 0
  • 约8.48万字
  • 约 12页
  • 2026-03-23 发布于广东
  • 举报

通过视觉语言预训练实现医学图像和文本的多模态理解与生成.pdf

1

Multi-modalUnderstandingandGenerationforMedical

ImagesandTextviaVision-LanguagePre-Training

JongHakMoon,HyungyungLee,WoncheolShin,Young-HakKim,andEdwardChoi

Abstract—Recentlyanumberofstudiesdemonstrated

impressiveperformanceondiversevision-languagemulti-

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档