人形机器人行业专题报告(一)-Figure×OpenAI：端到端的大语言-视觉模型让“机器”变“人”-240314.pdf

下载文档

2
0
约2.03万字
约 12页
2024-03-28 发布于内蒙古
举报
版权申诉
保障服务

人形机器人行业专题报告(一)-Figure×OpenAI：端到端的大语言-视觉模型让“机器”变“人”-240314.pdf

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

证券研究报告|行业专题|机械设备

机械设备报告日期：2024年03月14日

Figure×OpenAI：端到端的大语言-视觉模型让“机器”变“人”

——人形机器人行业专题报告（一）

投资要点

行业评级:看好(维持)

❑Figure×OpenAI的最新视频呈现了什么亮点？

Figure01最新视频表明了大语言-视觉模型介入人形机器人后，所带来的极快升分析师：张雷

级。近日人形机器人初创公司Figure公布其与OpenAI合作13天后的机器人最新执业证书号：S1230521120004

视频，视频中OpenAI将其端到端的大语言-视觉模型移植到Figure01上，Figurezhanglei02@

01能够1)理解区分面前的场景对象；2)动作上区分苹果和一堆纸团；3)理解自身

研究助理：虞方林

行为的目的；4)判断下一步的响应动作；5)评价自身行为；6)手指灵活度足够且动

yufanglin@

作较快。就目前所呈现的状态，我们认为人形机器人有望打开C端市场。

❑大语言-视觉模型对Figure01的加持体现在哪？相关报告

源自OpenAI端到端的大语言-视觉模型是本次Figure01升级的核心，从语言输1《特斯拉Optimus引领技术实

入开始，模型接管了一切处理，直接输出语言和行为结果，而不是中间输出一些

现，国产零部件迎来机遇》

结果，再加载其他程序处理这些结果。其中Open的大模型提供负责提供视觉推理

和语言理解，而Figure的神经网络提供快速、低水平、灵巧的机器人动作，值得2024.03.13

注意的是机器人所有行为均源自于自身学习过的。升级主要体现在以下两方面：

(1)语言交互流程：研究人员将机器人摄像头中的图像输入、机载麦克风捕获的语

音中的文本转录到由OpenAI训练的，可以理解图像和文本的多模态模型(VLM)

中，由该模型处理对话的整个历史记录，得出语言响应，然后通过文本到语音的

方式将其回复给人类。

(2)动作处理流程：大模型能力可以使机器人拥有短期记忆，以便联系和理解前后

的行为关系。首先，互联网预训练模型对图像和文本进行常识推理，以得出高级

计划；其次，大模型以200hz的频率生成的24-DOF动作(手腕姿势和手指关节角

度)，充当高速设定点，供更高速率的全身控制器跟踪，以确保安全和稳定。

❑Figure公司背景和优势如何？

Figure由BrettAdcock于2022年创立，总部位于加利福尼亚，其目标是开发能够

在不同环境中工作并处理各种任务的通用型人形机器人，覆盖仓储到零售。团队

主要来自IHMC、波士顿动力、特斯拉、Waymo和谷歌X等机构。在融资、技术

及落地方面，Figure获得来自英特尔、微软、OpenAI、英伟达等科技巨头和宝马

汽车的支持。其中Figure与OpenAI达成协议，共同开发“下一代人形机器人的人

工智能模型”，GPT有望成为机器人大脑；微软为Figure提供访问其云计算平台

Azure的人工智能基础设施、培训和存储服务；与宝马合作，将其自身的AI与机

器人技术融入到宝马实际的汽车生产流程中。

❑投资建议

目前Figure与各科技巨头签署系列协议，有望形成“模型训练-云端设施-车厂落

地”商业闭环，并在行业加速扩散。我们认为，人形机器人的产业大趋势已经确定，

当前人形机器人厂商陆续更新的视频表现均超预期，这主要

您可能关注的文档

文档评论（0）

139****3154 + 关注: 实名认证

内容提供者

8年软件开发，5年房地产开发，5年金融产品设计

咨询Ta 进入空间

1亿VIP精品文档

更多 >

人形机器人行业专题报告(一)-Figure×OpenAI：端到端的大语言-视觉模型让“机器”变“人”-240314.pdf