- 1
- 0
- 约2.1万字
- 约 6页
- 2026-05-14 发布于福建
- 举报
专题月2025年8月
第1卷第4期
计算第
视觉-语言-动作(VLA)模型的
前世今生
王寄哲张伟男刘挺
哈尔滨工业大学
引言令映射到物理动作,上下文理解和泛化能力显著增强
如图1所示,传统机器人系统通常采用模块化设
视觉语言-动作(vision-language-action,VLA)模计,如分别训练感知、规划和控制模块,这种方法易受
型在2023年7月谷歌DeepMind发布RT-2模型时单个模块误差影响并难以实现跨任务的泛化。相较之
首次被正式提出,引发了学术界对多模态感知与机器下,VLA模型端到端框架可以减少模块间传递的累积
人动作一体化的广泛关注。随后,斯坦福大学等机构误差,并凭借预训练大规模视觉语言模型所带来的丰
于2024年发布OpenVLA[
您可能关注的文档
- 智能时代人机协同道德学习探索.pdf
- 智能时代情感教育的价值反思与关系再构.pdf
- 智能机器人发展传播史研究.pdf
- 生成式人工智能时代的课堂道德叙事.pdf
- 生成式人工智能深度求索(DeepSeek)重塑智慧图书馆用户信息行为研究.pdf
- 生成式人工智能驱动的中小学舞蹈教学范式重构:基于具身认知的虚实融合实践探讨.pdf
- 空间性视域下的人工智能进化范式研究——列斐伏尔三元辩证法的认识论启示.pdf
- 第六届中国智能机器人学术年会(CCF CIRAC 2025)征文通知 (1).pdf
- 第六届中国智能机器人学术年会(CCF CIRAC 2025)征文通知.pdf
- 职业教育智慧学习空间的应然诉求、模型构建与发展路径.pdf
- 科技行情结束了吗?.docx
- 工控&电网25Q4&26Q1总结:工控进一步复苏,电网景气度保持.docx
- 寻找中国保险的Alpha系列之五:保险还要买多少红利?.docx
- 消费级AR眼镜系列报告(三):AR眼镜核心技术:光波导演进、材料革新与微显示升级.docx
- 北交所策略专题报告:掘金精细化育儿新需求:北交所母婴产业链的辅食、卫生用品与营养品机遇.docx
- 超高性能混凝土(UHPC)材料:在建筑幕墙中的应用.docx
- 环保行业周报:SAF价格创新高,UCO价格有望补涨.docx
- 国防军工行业投资策略:军贸与商业航天共振,静待新质战斗力订单催化.docx
- 计算机行业“一周解码”:豆包开启付费订阅测试,Anthropic发力C端,大模型商业化加速中.docx
- 传媒行业5月投资策略:关注AI应用叙事逻辑改善可能,把握游戏与IP潮玩底部机会.docx
最近下载
- GB/T 45053-2024乙烯装置用透平压缩机.pdf
- 2026年四川公考笔试真题及答案.doc VIP
- 湖南工业大学《模拟电子技术A》2022-2023学年第一学期期末试卷.doc VIP
- (高清版)-B-T 5267.1-2023 紧固件 电镀层.pdf VIP
- T CECS G:D60-02—2023 公路超高性能混凝土(UHPC)桥梁技术规程.pdf VIP
- 湖南工程学院《电力电子技术A》2022-2023学年期末试卷.doc VIP
- 2025至2030年中国活塞飞机行业市场深度评估及投资战略规划报告.docx
- 电网关键线路辨识与连锁故障风险评估:理论、方法与实践.docx VIP
- 基于Nakagami - m衰落的高移动性无线信道建模与仿真研究.docx VIP
- 湖南工业大学《电力电子技术A》2021-2022学年第一学期期末试卷.doc VIP
原创力文档

文档评论(0)