通义多模态、多端GUI智能体Mobile-Agent技术实践与应用.pdf

通义多模态、多端GUI智能体Mobile-Agent技术实践与应用.pdf

通义多模态、多端GUI智能体

Mobile-Agent

徐海洋|阿里巴巴-通义实验室

徐海洋

阿里巴巴通义实验室高级算法专家

阿里通义实验室高级算法专家,负责通义Mobile-Agent、mPLUG等系

列工作,包括多模态智能体Mobile-Agent、多模态大模型mPLUG/

mPLUG-Owl/QwenVL,多模态文档大模型mPLUG-DocOwl等,其中

mPLUG工作在VQA榜单首超人类的成绩,Mobile-Agent工作

CCL2024

文档评论(0)

1亿VIP精品文档

相关文档