通义多模态、多端GUI智能体Mobile-Agent技术实践与应用.pptx

通义多模态、多端GUI智能体Mobile-Agent技术实践与应用.pptx

通义多模态、多端GUI智能体

Mobile-Agent

徐海洋|阿里巴巴-通义实验室

阿里通义实验室高级算法专家,负责通义Mobile-Agent、mPLUG等系

列工作,包括多模态智能体Mobile-Agent、多模态大模型mPLUG/

mPLUG-Owl/QwenVL,多模态文档大模型mPLUG-DocOwl等,其中mPLUG工作在VQA榜单首超人类的成绩,Mobile-Agent工作CCL2024、2025两年BestDemo,获得多个多模态榜单第一和BestPaper。在国际顶级期刊和会议ICML/NeurIPS/ICLR/CV

文档评论(0)

1亿VIP精品文档

相关文档