具身智能产业深度：技术模型分析、市场展望、相关产业及公司深度梳理.pdfVIP

下载本文档

1
0
约1.52万字
约 18页
2025-11-24 发布于湖南
举报
版权申诉

具身智能产业深度：技术模型分析、市场展望、相关产业及公司深度梳理.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

特斯拉2023年股东会上，马斯克表示，人形机器人将是今后特斯拉主要的长期价值来源，

“如果人形机器人和人的比例是2比1左右，那么人们对机器人的需求量可能是100亿乃至200

亿个，远超电动车的数量”。英伟达创始人黄仁勋在ITFWorld2023半导体大会上也表示，

AI下一个浪潮将是“具身智能”。

“具身智能”意指有身体并支持物理交互的智能体，人形机器人为标杆产品。具身智能，首先

需要听懂人类语言，分解任务、规划子任务，移动中识别物体，与环境交互，最终完成任务。

人形机器人很好的契合了具身智能的要求，有望成为标杆应用。

围绕具身智能，我们从下面几方面展开讨论：具身智能的概念是如何定义的，具体方案模块是

如何设置的，发展历程又是怎样的，相关技术及模型有哪些，可能受益的相关公司都有哪些。

希望通过这些问题的探讨，让我们对于具身智能有个浅显的了解。

（更多投研内容可关注公众号《投研锋向》加入社群，体验更多0预期差纪要信息）

具身智能概述

1.概念

具身智能（EmbodiedIntelligence）是指一种具备自主决策和行动能力的机器智能，它可以

像人类一样感知和理解环境，通过自主学习和适应性行为来完成任务。要实现具身智能与环境

实时交互并完成自主做事的功能，其所涉及到的主要环节可以抽象理解为包括感知、传输、决

策、执行。

感知层类似人的五官，负责收集环境信息，在单一场景下机器或许可以通过感知来绕过决策控

制，比如1986年，美国著名机器人制造专家罗德尼·布鲁克斯（RodneyBrooks）研发了第一

个基于感知行为模式的轮式机器人，不需要中枢控制可以实现避让、前进和平衡等功能，但是

如果想要让机器实现与人类互动并完成多样化指令要求，它面对的可能是结合了语言、图像等

多个模态的复杂信息，决策层的多模态处理就显得不可或缺。

决策层作为核心处理枢纽，需要类似人类大脑的处理能力，满足机器在理解指令、分解任务、

规划子任务、识别物体完成人机交互和环境交互等方面的需求，多维度的人机交互在传统的机

器人领域是一大难题，因而当下的研究更多体现在特定指令下对于环境交互的探索，也即如何

更智能地执行特定物理任务上。而ChatGPT等AI大模型的快速突破提供了新的思路，有望充

当机器人的大脑与人类进行多维度交互，从而更为出色完成任务。

此外，随着感知和决策的复杂化，传输层对于的实时性的要求日益提升，从而对传输速率和边

缘计算等提出更高的需求。

2.PIE方案是实现具象智能的解决方案之一

PIE方案是实现具象智能的解决方案之一，可分为三个模块——具身感知（Perception）、具

身想象（Imagination）和具身执行（Execution）。

具象感知（Perception）：交互感知，自动挖掘、定义具象概念。可以通过两种方式实现：

1）全感知：构建一个大规模的数据库，包含我们所操作的这个世界模型（worldmodel）的

各种各样的知识，跟操作相关的知识，包括外形、结构、语义，以及48个真实世界关节体类别

等；2）具身交互感知：各种内容交互的感觉带来的全新感知，通过牛顿定律和数据驱动的结

合，不断修正误差从而得到正确的模型。

具象想象（Imagination）：自动具身任务模拟，仿真引擎构建。通过名为RFUniverse的仿

真引擎，这个仿真引擎支持7种物体（比如关节可移动的、柔性的、透明的、流体的……）、

87种原子操作的仿真。当研究人员把物体输入，模型会在仿真引擎中进行想象操作。

具身执行（Execution）：多传感器合作，自意识执行误差。研究人员通过构建一个元操作

库，调用各种元操作来解决执行的问题。通过半自动的datacollectio

您可能关注的文档

文档评论（0）

Kaiser + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

具身智能产业深度：技术模型分析、市场展望、相关产业及公司深度梳理.pdfVIP