- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
索引
索引
内容目录
一、AI行业重点事件点评 3
Figure推出Helix模型,实现多机器人“共脑”合作 3
阿里巴巴业绩稳健增长,加速AI与云计算布局,打造全球领先的智能生态 5
二、AI行业动态一览 7
国外行业动态 7
AI大模型 7
应用 8
国内行业动态 8
AI大模型 8
应用 9
三、AI行情回顾:A股液冷散热和铜互连方向领涨,美股整体下跌 9
四、投资建议:持续关注AI应用和算力基础设施 10
五、风险提示 10
图表目录
图1:Figure推出“共脑”机器人Helix 3
图2:新型扩展法则提升Helix模型扩展行为能力的效率 4
图3:Helix双系统模型架构与工作流程 5
图4:阿里云AI基础设施全景 6
图5:通义千问开源进程 7
图6:阿里云全球基础设施规划 7
图7:A股AI行业细分板块周涨跌幅对比(02.17-02.21) 10
图8:美股AI行业细分板块周涨跌幅对比(02.17-02.21) 10
一、AI行业重点事件点评
Figure推出Helix模型,实现多机器人“共脑”合作
近期,Figure公司推出了自主研发的Helix模型,这是一个集视觉、语言理解和动作控制于一体的视觉-语言-动作(VLA)模型,标志着机器人技术的重大突破。Helix能够让机器人通过自然语言指令执行复杂任务,例如拾取物品、放入冰箱等。更为重要的是,它首次实现了两个机器人“共脑”合作,即多个机器人可以共享同一模型权重,在没有特定任务示范的情况下灵活协调,完成长序列操作任务。这一成就不仅提高了机器人技术的智能化水平,也让家庭机器人和商业应用的落地变得更加可行。
图1:Figure推出“共脑”机器人Helix
51CTO, 研发中心
核心架构采用双系统设计,实现高效智能推理和实时控制。Helix采用“系统1-系统2”
(S1-S2)解耦设计,以解决传统VLM(视觉语言模型)和机器人运动策略各自的局限性。以往的VLM主干网络虽然具备通用性,但运行速度较慢,而机器人运动策略虽然快,但缺乏泛化能力。Helix通过整合这两种能力,使机器人既能理解高层语义信息,又能实时调整动作以适应复杂场景。其中,系统2(S2)负责场景和语言理解,采用7B参数的开源模型,通过互联网规模的数据进行预训练,并以7-9Hz的频率解析机器人摄像头的图像输入、机器人状态信息(如手腕姿态、手指位置等)。S2结合自然语言指令,将任务相关的语义信息转换为潜层向量,为S1提供决策依据。而系统1(S1)专注于机器人实时运动控制,基于80M参数的Transformer,利用全卷积多尺度视觉主干网络,在200Hz的高频率下执行机器人控制指令。S1接收S2提供的潜层向量,并结合机器人的实时传感信息,对动作进行快速调整,确保机器人可以精准操作物体,如抓取、旋转、放置等。
Helix相比现有方法具有以下关键优势:
速度和泛化能力:Helix不仅达到了专门针对单任务行为克隆(behavioralcloning)策略的运行速度,还能够对数千个全新测试对象实现零样本学习,显著提高了机器人适应未知环境的能力。
可扩展性:Helix能够直接输出高维动作空间的连续控制,避免了先前VLA方法中使
用的复杂动作token化方案。这些方案虽然在低维控制设置(如二指夹爪)中取得了一定成功,但在高维人形机器人控制中面临扩展性挑战。Helix的架构能够适应更复杂的机器人任务,并支持未来的扩展。
架构简单:Helix采用标准架构,其中系统2(S2)使用开源、开放权重的视觉语言模型,系统1(S1)则采用基于Transformer的视觉运动策略,极大地简化了架构,使其更具可维护性和灵活性。
职责分离:通过S1和S2的“解耦”,Helix能够独立迭代优化每个系统,无需受限于寻找统一的观察空间或动作表示。这种设计使Helix能够更高效地执行任务,同时提升机器人在不同场景下的适应性。
图2:新型扩展法则提升Helix模型扩展行为能力的效率
Figure官网, 研发中心
采用端到端学习方法,通过少量训练数据实现泛化学习。Helix的训练过程充分利用了端到端学习方法,使机器人能够从数据中直接学习控制策略,而无需依赖复杂的微调机制。为了提升泛化能力,研究团队收集了500小时的高质量监督数据,涵盖了多机器人、多操作员的遥操作行为。训练数据主要来源于多种机器人操作场景,涉及各种物品的抓取、移动和放置任务。研究人员使用自动标注VLM来生成指令,使模型能够基于自然语言输入
进行泛
您可能关注的文档
- 港股当前最关键的七个问题.docx
- 光与影:日本走出通缩的现实与隐忧.docx
- 1年以内信用债,跌出来的价值.docx
- 1月能繁环比略有回落,饲料价格随原材料有所反弹.docx
- 2月海外月度观察:政策预期阶段性转稳,通胀压力边际回升.docx
- 2025J.P.Morgan医疗健康行业大会MNC总结:全球盛会共话交易合作,创新驱动医药行业变革.pptx
- 2025Q1国内经济与资产展望:经济平稳开局,股债资产切换.pptx
- 2025年广东碳市场会有哪些变化?.docx
- AI电气设备把握电源%26液冷%26配套电力设备机遇.pptx
- AI行业跟踪报告第期:华勤技术,AI云、端全线卡位,全面受益于AI落地.docx
- 2021海湾消防GST-HX-420BEx 火灾声光警报器安装使用说明书.docx
- 2022海湾消防 GST-LD-8316Ex 手自动转换装置安装使用说明书.docx
- (小升初押题卷)江苏省小升初重难点高频易错培优卷(试题)-2024-2025学年六年级下册数学苏教版.docx
- 2023-2024学年吉林省吉林市舒兰市人教版四年级上册期末考试数学试题.docx
- 2023-2024学年北京市密云区北京版四年级上册期末考试数学试卷.docx
- 2024-2025学年广东省广州市天河区人教版三年级上册期末考试数学试卷.docx
- 2024-2025学年河北省唐山市丰南区人教版五年级上册期末测试数学试卷.docx
- 人教版道德与法治一年级下册第4课《我们有精神》课件.pptx
- 消防蝶阀介绍.pptx
- 室外消火栓设置场所及设置要求.pptx
文档评论(0)