多模态推理与行动:视觉、数学及理解综合应用.pdfVIP

  • 3
  • 0
  • 约17.86万字
  • 约 62页
  • 2026-04-22 发布于北京
  • 举报

多模态推理与行动:视觉、数学及理解综合应用.pdf

MM‑REACT:提示ChatGPT进行多模态推理和行动

∗∗∗∗∗∗

,,,KevinLin,EhsanAzarnasab,FaisalAhmed,刘

自成,,♠微软AzureAI

{zhengyang,lindsey.li,jianfw,keli,ehazar,fiahmed,zliu,ce.liu,nzeng,lijuanw}@.comom

3

2视觉数学和文本推理视觉条件下的笑话/表情包空间/坐标理解

0第一个方程中的“a”?有什么好笑的地方?飞盘在哪里?

2最后一个方程中的y?

文档评论(0)

1亿VIP精品文档

相关文档