网站大量收购独家精品文档,联系QQ:2885784924

AI行业跟踪48期:Figure推出Helix模型,阿里巴巴加速布局AI和云.docx

AI行业跟踪48期:Figure推出Helix模型,阿里巴巴加速布局AI和云.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

索引

索引

内容目录

一、AI行业重点事件点评 3

Figure推出Helix模型,实现多机器人“共脑”合作 3

阿里巴巴业绩稳健增长,加速AI与云计算布局,打造全球领先的智能生态 5

二、AI行业动态一览 7

国外行业动态 7

AI大模型 7

应用 8

国内行业动态 8

AI大模型 8

应用 9

三、AI行情回顾:A股液冷散热和铜互连方向领涨,美股整体下跌 9

四、投资建议:持续关注AI应用和算力基础设施 10

五、风险提示 10

图表目录

图1:Figure推出“共脑”机器人Helix 3

图2:新型扩展法则提升Helix模型扩展行为能力的效率 4

图3:Helix双系统模型架构与工作流程 5

图4:阿里云AI基础设施全景 6

图5:通义千问开源进程 7

图6:阿里云全球基础设施规划 7

图7:A股AI行业细分板块周涨跌幅对比(02.17-02.21) 10

图8:美股AI行业细分板块周涨跌幅对比(02.17-02.21) 10

一、AI行业重点事件点评

Figure推出Helix模型,实现多机器人“共脑”合作

近期,Figure公司推出了自主研发的Helix模型,这是一个集视觉、语言理解和动作控制于一体的视觉-语言-动作(VLA)模型,标志着机器人技术的重大突破。Helix能够让机器人通过自然语言指令执行复杂任务,例如拾取物品、放入冰箱等。更为重要的是,它首次实现了两个机器人“共脑”合作,即多个机器人可以共享同一模型权重,在没有特定任务示范的情况下灵活协调,完成长序列操作任务。这一成就不仅提高了机器人技术的智能化水平,也让家庭机器人和商业应用的落地变得更加可行。

图1:Figure推出“共脑”机器人Helix

51CTO, 研发中心

核心架构采用双系统设计,实现高效智能推理和实时控制。Helix采用“系统1-系统2”

(S1-S2)解耦设计,以解决传统VLM(视觉语言模型)和机器人运动策略各自的局限性。以往的VLM主干网络虽然具备通用性,但运行速度较慢,而机器人运动策略虽然快,但缺乏泛化能力。Helix通过整合这两种能力,使机器人既能理解高层语义信息,又能实时调整动作以适应复杂场景。其中,系统2(S2)负责场景和语言理解,采用7B参数的开源模型,通过互联网规模的数据进行预训练,并以7-9Hz的频率解析机器人摄像头的图像输入、机器人状态信息(如手腕姿态、手指位置等)。S2结合自然语言指令,将任务相关的语义信息转换为潜层向量,为S1提供决策依据。而系统1(S1)专注于机器人实时运动控制,基于80M参数的Transformer,利用全卷积多尺度视觉主干网络,在200Hz的高频率下执行机器人控制指令。S1接收S2提供的潜层向量,并结合机器人的实时传感信息,对动作进行快速调整,确保机器人可以精准操作物体,如抓取、旋转、放置等。

Helix相比现有方法具有以下关键优势:

速度和泛化能力:Helix不仅达到了专门针对单任务行为克隆(behavioralcloning)策略的运行速度,还能够对数千个全新测试对象实现零样本学习,显著提高了机器人适应未知环境的能力。

可扩展性:Helix能够直接输出高维动作空间的连续控制,避免了先前VLA方法中使

用的复杂动作token化方案。这些方案虽然在低维控制设置(如二指夹爪)中取得了一定成功,但在高维人形机器人控制中面临扩展性挑战。Helix的架构能够适应更复杂的机器人任务,并支持未来的扩展。

架构简单:Helix采用标准架构,其中系统2(S2)使用开源、开放权重的视觉语言模型,系统1(S1)则采用基于Transformer的视觉运动策略,极大地简化了架构,使其更具可维护性和灵活性。

职责分离:通过S1和S2的“解耦”,Helix能够独立迭代优化每个系统,无需受限于寻找统一的观察空间或动作表示。这种设计使Helix能够更高效地执行任务,同时提升机器人在不同场景下的适应性。

图2:新型扩展法则提升Helix模型扩展行为能力的效率

Figure官网, 研发中心

采用端到端学习方法,通过少量训练数据实现泛化学习。Helix的训练过程充分利用了端到端学习方法,使机器人能够从数据中直接学习控制策略,而无需依赖复杂的微调机制。为了提升泛化能力,研究团队收集了500小时的高质量监督数据,涵盖了多机器人、多操作员的遥操作行为。训练数据主要来源于多种机器人操作场景,涉及各种物品的抓取、移动和放置任务。研究人员使用自动标注VLM来生成指令,使模型能够基于自然语言输入

进行泛

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档