具身智能产业深度: 技术模型分析、市场展望、相关产业及公司深度梳理.pdfVIP

具身智能产业深度: 技术模型分析、市场展望、相关产业及公司深度梳理.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

特斯拉2023年股东会上,马斯克表示,人形机器人将是今后特斯拉主要的长期价值来源,

“如果人形机器人和人的比例是2比1左右,那么人们对机器人的需求量可能是100亿乃至200

亿个,远超电动车的数量”。英伟达创始人黄仁勋在ITFWorld2023半导体大会上也表示,

AI下一个浪潮将是“具身智能”。

“具身智能”意指有身体并支持物理交互的智能体,人形机器人为标杆产品。具身智能,首先

需要听懂人类语言,分解任务、规划子任务,移动中识别物体,与环境交互,最终完成任务。

人形机器人很好的契合了具身智能的要求,有望成为标杆应用。

围绕具身智能,我们从下面几方面展开讨论:具身智能的概念是如何定义的,具体方案模块是

如何设置的,发展历程又是怎样的,相关技术及模型有哪些,可能受益的相关公司都有哪些。

希望通过这些问题的探讨,让我们对于具身智能有个浅显的了解。

(更多投研内容可关注公众号《投研锋向》加入社群,体验更多0预期差纪要信息)

01

具身智能概述

1.概念

具身智能(EmbodiedIntelligence)是指一种具备自主决策和行动能力的机器智能,它可以

像人类一样感知和理解环境,通过自主学习和适应性行为来完成任务。要实现具身智能与环境

实时交互并完成自主做事的功能,其所涉及到的主要环节可以抽象理解为包括感知、传输、决

策、执行。

感知层类似人的五官,负责收集环境信息,在单一场景下机器或许可以通过感知来绕过决策控

制,比如1986年,美国著名机器人制造专家罗德尼·布鲁克斯(RodneyBrooks)研发了第一

个基于感知行为模式的轮式机器人,不需要中枢控制可以实现避让、前进和平衡等功能,但是

如果想要让机器实现与人类互动并完成多样化指令要求,它面对的可能是结合了语言、图像等

多个模态的复杂信息,决策层的多模态处理就显得不可或缺。

决策层作为核心处理枢纽,需要类似人类大脑的处理能力,满足机器在理解指令、分解任务、

规划子任务、识别物体完成人机交互和环境交互等方面的需求,多维度的人机交互在传统的机

器人领域是一大难题,因而当下的研究更多体现在特定指令下对于环境交互的探索,也即如何

更智能地执行特定物理任务上。而ChatGPT等AI大模型的快速突破提供了新的思路,有望充

当机器人的大脑与人类进行多维度交互,从而更为出色完成任务。

此外,随着感知和决策的复杂化,传输层对于的实时性的要求日益提升,从而对传输速率和边

缘计算等提出更高的需求。

2.PIE方案是实现具象智能的解决方案之一

PIE方案是实现具象智能的解决方案之一,可分为三个模块——具身感知(Perception)、具

身想象(Imagination)和具身执行(Execution)。

具象感知(Perception):交互感知,自动挖掘、定义具象概念。可以通过两种方式实现:

1)全感知:构建一个大规模的数据库,包含我们所操作的这个世界模型(worldmodel)的

各种各样的知识,跟操作相关的知识,包括外形、结构、语义,以及48个真实世界关节体类别

等;2)具身交互感知:各种内容交互的感觉带来的全新感知,通过牛顿定律和数据驱动的结

合,不断修正误差从而得到正确的模型。

具象想象(Imagination):自动具身任务模拟,仿真引擎构建。通过名为RFUniverse的仿

真引擎,这个仿真引擎支持7种物体(比如关节可移动的、柔性的、透明的、流体的……)、

87种原子操作的仿真。当研究人员把物体输入,模型会在仿真引擎中进行想象操作。

具身执行(Execution):多传感器合作,自意识执行误差。研究人员通过构建一个元操作

库,调用各种元操作来解决执行的问题。通过半自动的datacollectio

文档评论(0)

Kaiser + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档