- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE1
PAGE1
投资要点
数据是推动具身智能技术快速突破和落地应用的关键。借鉴自动驾驶汽车发展的路径,数据对于具身智能同样至关重要。优质的数据集能够驱动智能体感知与理解环境,能够加速具身智能模型的训练与部署,帮助机器人有效完成复杂任务。不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。符合通用标准、得到验证的数据集成为具身智能行业的刚需。当前具身智能本体
形态多种多样,应用场景千差万别,对于具身智能训练数据的需求也更为多元。目前业内仍有部分数据集主要聚焦在特定机器人、特定场景和特定技能等方面,在整体通用性上有待提升。因此,构建高质量、多样化的感知数据集是不可或缺的基础工作,这些数据集不仅为算法训练提供了丰富的素材,也成为了评估具身性能的基准参考标准。
具身智能数据按采集方式主要分为真实数据和仿真数据两大类。(1)真实数据:真实数据是智能体通过自身物理身体上的各类传感器(如摄像头、麦克风、触觉传感器等),在与真实物理环境进行交互过程中,实时采集获取的数据。真实数据主要来源有:机器人遥操(通过人工远程操控获取真实场景下的操作数据)、动作捕捉(记录人类在特定环境中的行为模式)。(2)仿真数据:借助计算机模拟技术,在虚拟环境中生成的、用于训练具身智能的数据。通过构建虚拟场景、物体和智能体,模拟智能体与虚拟环境的交互过程来产生数据。即利用仿真环境生成训
练数据。真实数据和仿真数据两者是互补关系,未来训练将大量混合使用真实数据和高质量的合成数据。
当前具身智能数据多为厂商自采集,存在丰富开源数据集。当前给人形机器人采集的高质量数据通常在现实世界中获取,采集方式主要有直接接触数据(真机数据)和间接接触数据(人工控制数据)两种。最理想的数据采集方式是通过人形机器人本体直接触达物理世界,让其准确理解真实环境。大规模真机数据的采集成本高昂,需要投入许多人力、物力和时间资源,数据标注和采集设备都存在门槛。目前市面上存在丰富的高质量具身智能开源数据集,如智元、谷歌、国地共建中心等均开源了丰富的具身智能数据集,具备丰富的演示数量、场景任务和动作技能
等。
机器人仿真数据主要依赖虚拟场景,而场景的合成方案可拆解成两个关键部分:场景生成(G¤n)与模拟(Si?)。场景生成引擎(G¤n)主要有两种技术路径:合成视频+3D重建:基于像素流驱动,先生成视频或图像,再重建为点云或?¤sh等非结构化3D数据,最终转为结构化语义模型。如Hillb○t、群核科技、T○rldlabs(李飞飞)等。AlG1直接合成3D数据:利用图神经网络(GNN)、扩散模型(Diffusi○n)、注意力机制
(Att¤nti○n)等方法,直接合成结构化空间数据。如ATlSS、LEGO–N¤t、DiffuS?¤n¤、R○○?F○r?¤r等代表模型,部分方案结合程序化生成技术,如lnfinig¤n(1?PR2024)。
投资建议与相关标的:数据是推动具身智能技术快速突破和落地应用的关键,重点关注布局具身智能数据集的企业,相关标的:均胜电子(数
据场)、海天瑞声(机器人数据集)、索辰科技(数据仿真)、华如科技(数据仿真)。
风险提示:相关政策不及预期、各类型企业lT预算不及预期、市场竞争加剧。
研究成果
1、具身智能数据集基本概念
2、国内外具身智能真实数据集现状
3、国内外具身智能仿真数据集现状
4、相关标的
7、风险提示
具身智能数据集基本概念
具身智能数据集基本概念
PAGE4
PAGE4
数据来源:东吴证券研究所绘制
具身智能的世界级难题:数据
具身智能四个最关键的因子:算法、算力、机器人硬件、数据。
算法层面:1hatGPT、D¤¤ps¤¤k、通义千问等一系列领先的模型,在算法层面国内处于引领地位。
算力层面:国外以英伟达、AMD为代表,国内以寒武纪、海光信息、地平线等公司为代表,正在快速突围。目前在训练阶段的算力瓶
颈已经解决。
机器人硬件层面:中国目前具有丰富的产业链。
数据层面:目前仍是世界级难题,如何给机器人提供用来训练的可交互的数据是未来具身智能工作的重点之一。
图:具身智能四大关键因子算法
图:具身智能四大关键因子
算法
算力
具身智能
机器人硬件
数据
PAGE5
PAGE5
数据来源:生境科技,东吴证券研究所
具身智能浪潮来袭,数据供给瓶颈亟待突破
数据是推动具身智能技术快速突破和落地应用的关键。借鉴自动驾驶汽车发展的路径,数据对于具身智能同样至关重要。优质的数据集能够驱动智能体感知与理解环境,能够加速具身智能模型的训练与部署,帮
您可能关注的文档
- 20160426深交所通源石油2016年第一季度报告全文31556kb.docx
- 20250629平安证券石油石化行业2025年中期策略报告短期关注地缘中期锚定供需312mb.docx
- 20250909东证期货原油和石油产品海运贸易流跟踪298mb.docx
- 20250916东证期货原油和石油产品海运贸易流跟踪298mb.docx
- 20251013东证期货原油和石油产品海运贸易流跟踪298mb.docx
- 20251110国贸期货液化石油气(LPG)投资周报美国货进口预期增强PG盘面震荡整理运行392mb.docx
- 石油石化行业2025年中期策略报告短期关注地缘中期锚定供需312mb.docx
- 20250211东证期货原油和石油产品海运贸易流跟踪307mb.docx
- 20251020国贸期货液化石油气(LPG)投资周报丙弱丁强走势分化内盘PG估值向上修复382mb.docx
- 20251027国贸期货液化石油气(LPG)投资周报地缘风险事件再驱动LPG价格持续反弹392mb.docx
最近下载
- 2003年房地产估师考试《房地产开发经营与管理》真题及答案-中大网校.doc VIP
- 职业生涯报告六篇.pdf VIP
- 弧度制、扇形的弧长与面积.PDF VIP
- 2024-2030年中国纺织行业十四五发展分析及投资前景与战略规划研究报告.docx VIP
- 2025云南省交通投资建设集团有限公司下属云南省交通科学研究院有限公司管理人员招聘16人笔试参考题库附答案解析.docx VIP
- 《电子商务安全技术》考试复习题库(含答案).docx VIP
- 人工智能数学基础-全套PPT课件.pptx
- 山东名校2025届高三12月校际联合检测 生物试卷(含答案解析).docx
- 职业计划生涯范文5篇.docx VIP
- 成功必备的八大心态.ppt VIP
原创力文档


文档评论(0)