- 0
- 0
- 约3.51万字
- 约 15页
- 2026-03-09 发布于北京
- 举报
视觉-听觉手部姿态和接触估计
YueminMaoUksangYooYunchaoYaoShahramNajamSyed
LucaBondiJonathanFrancisJeanOhJeffreyIchnowski
*同等贡献。
1卡内基梅隆大学机器人研究所,匹兹堡,美国
2博世人工智能中心,匹兹堡,美国
本
译Abstract
中准确估计手部姿态和手-物体接触事件对于机器人数据采集、沉浸式虚拟环
1境和生物力学分析至关重要,但由于视觉遮挡、微妙的接触线索、仅限视
v
2觉感知的限制以及缺乏可访问且灵活的触觉传感而仍然具有挑战性。因此
5我们引入了VibeMesh,这是一种将视觉与主动声学感知融合的新颖穿戴系
8
0统,用于密集的手部顶点接触和姿态估计。VibeMesh集成了骨传导扬声器和
0稀疏压电麦克风,分布在人手上,发出结构化声学信号并捕捉其传播以推断
.
8由接触引起的变化。为了解释这些跨模式信号,我们提出了一种基于图的注
0意力网络,该网络处理同步音频频谱和从RGB-D导出的手部网格来预测高
5
2空间分辨率下的接触。我们的贡献包括:(i)一种轻量级、非侵入式的视觉-声
:学传感平台;(ii)联合姿态和接触推断的跨模式图网络;(iii)同步的RGB-D、
v
i声学和真实接触注释的数据集,覆盖多种操作场景;以及(iv)经验结果显示
x
rVibeMesh在精度和鲁棒性方面优于仅视觉基准,尤其是在遮挡或静止接触
a
设置中。
1介绍
准确估计人类手部姿态和接触对于机器人遥操作[30,59,9,55]、虚拟现实[52,1]和生物力
学分析[10,35,31]至关重要。在所有这些场景中,了解当和其中手部如何接触环境——连同
其配置——使人们能够推理任务阶段,区分探索与操作,并推断力的动力学。不幸的是,现
实世界的接触感知很难:遮挡、有限的传感器视角和微妙的触碰事件经常使纯视觉方法变得
困惑。
基于视觉的方法通常间接估计接触,将RGB或深度观测与对象几何和典型手部姿态的强先
验结合起来~[14,4,54,41]。模型拟合可以帮助~[47,48,20],但在光线不足的情况下仍然
失败,并且由于遮挡而存在模糊性。直接触觉解决方案,例如电容式和压电手套~[24,18]
或全身套装~[15],在信号保真度方面表现出色,但代价是体积大、成本高以及实用性有限。
同时,可穿戴声学~[57]和跨模态学习~[43]方面的前景进展尚未被用于密集的手对象接触
估计。
Preprint.Underreview.
Visual
Feature
ContactMicrophonesSpectrogramsVibeMeshModel
您可能关注的文档
- 关于宽带 ODDM 系统中多普勒斜视的特征与评估.pdf
- ModelNet40-E:一个面向点云分类的不确定性感知基准测试.pdf
- 通过对抗引导课程采样增强基于扩散的数据集蒸馏.pdf
- SketchAgent:从手绘草图生成结构化图表.pdf
- 具有风险保证的故障检测中的校准预测集通过显著性检验.pdf
- 展示了联网和自动驾驶车辆在网络安全、安全性和隐私问题方面的标准和方法.pdf
- WIP:通过 AI 驱动的同伴代理增强基于游戏的学习.pdf
- 基于图的交互增强网络用于稳健的多模态情感分析.pdf
- RoboLinker: 一种基于扩散模型的人类与陪伴机器人之间的匹配服装生成器.pdf
- CSIRO-LT 在 SemEval-2025 任务 11 中:适应多语言情感识别的大型语言模型.pdf
最近下载
- 管理学第六版王凤彬课后习题答案.docx VIP
- 2026 OpenClaw“养龙虾”必备入门课件.pptx
- JB∕T 14579-2023 滚动轴承 球面滚子.pdf
- 2026年江苏城乡建设职业学院单招职业技能测试模拟测试卷附答案.docx VIP
- 2025年互联网营销师用户激活与品牌故事传播专题试卷及解析.pdf VIP
- 2024年黑龙江旅游职业技术学院单招职业适应性测试模拟试题及答案解析.docx VIP
- GB 46031-2025《可燃粉尘工艺系统防爆技术规范》深度解读.pptx VIP
- 中国国家博物馆-研学手册.pdf
- GB50303-2015 建筑电气工程施工质量验收规范.docx VIP
- 啤酒瓶盖自动分拣机设计.docx VIP
原创力文档

文档评论(0)