摘要
摘要
服务机器人需融合多模态数据提升环境感知精度应对复杂任务,然而多源
异构信息由于数据形式、结构和语义表达差异难以映射到统一的特征空间以实
现有效对齐和融合。针对此问题,本研究重点探究视觉、触觉和听觉等多源数
据间的深层关联性和本质特征,并基于生成对抗网络构建异构模态空间的特征
转换模型,实现单模态或多模态输入向目标模态的特征映射。
(1)构建了一种跨模态生成模型(Research
摘要
摘要
服务机器人需融合多模态数据提升环境感知精度应对复杂任务,然而多源
异构信息由于数据形式、结构和语义表达差异难以映射到统一的特征空间以实
现有效对齐和融合。针对此问题,本研究重点探究视觉、触觉和听觉等多源数
据间的深层关联性和本质特征,并基于生成对抗网络构建异构模态空间的特征
转换模型,实现单模态或多模态输入向目标模态的特征映射。
(1)构建了一种跨模态生成模型(Research
文档评论(0)