- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120234654A(43)申请公布日2025.07.01
(21)申请号202510705395.3
(22)申请日2025.05.29
(71)申请人中天智领(北京)科技有限公司
地址100096北京市昌平区回龙观镇龙域
中街1号院1号楼2单元806
(72)发明人党战雄李红梅郭亮宋志标张啸轩
GO6V
GO6N
GO6N
GO6N
GO6N
GO6N
10/82(2022.01)
3/0464(2023.01)
3/042(2023.01)
3/0475(2023.01)3/094(2023.01)3/0455(2023.01)
(74)专利代理机构北京智行阳光知识产权代理
事务所(普通合伙)11738专利代理师张毅群
(51)Int.CI.
GO6F18/24(2023.01)
GO6F18/25(2023.01)
GO6F18/15(2023.01)
GO6V40/20(2022.01)
权利要求书3页说明书16页附图3页
(54)发明名称
采集信息视觉特征增强与人体骨骼信息互补校正特征融合得到统一特征表示对于低置信度动作识别结果
采集信息
视觉特征增强与人体骨骼信息互补校正
特征融合得到统一特征表示
对于低置信度动作识别结果
基于因果关系图谱补全图像信息
生成最终识别结果
(57)摘要
本发明提供基于多模态融合的空间交互精准识别方法及系统,涉及人工智能技术领域,包括通过采集人体骨骼、视觉图像和语音信息,利用特征提取网络生成时空注意力图增强视觉特征,执行特征互补校正,融合三种模态信息得到统一特征表示;当识别置信度低时,基于动作因果关系图谱引导的时空卷积生成对抗网络补全缺失图像帧,提高了空间交互识别的精确性和鲁
CN
CN120234654A
CN120234654A权利要求书1/3页
2
1.基于多模态融合的空间交互精准识别方法,其特征在于,包括:
采集人体骨骼信息和视觉图像信息和语音信息;
将所述人体骨骼信息和视觉图像信息输入至特征提取网络,所述特征提取网络基于所述人体骨骼信息中的关节点时空特征生成时空注意力图,将所述时空注意力图作用于视觉图像信息得到增强视觉特征;对所述人体骨骼信息和增强视觉特征执行特征互补校正;基于时序建模、特征对齐和跨模态注意力机制,将校正后的人体骨骼特征和视觉特征与语音信息特征进行融合,得到统一特征表示;
对所述统一特征表示进行动作识别,当识别结果的置信度低于预设置信度阈值时,对视觉图像信息中的缺失图像帧,基于动作因果关系图谱引导的时空卷积生成对抗网络进行补全,得到补全后的视觉图像信息;将所述补全后的视觉图像信息与人体骨骼信息和语音信息重新进行特征融合,得到最终的动作识别结果。
2.根据权利要求1所述的方法,其特征在于,所述特征提取网络基于所述人体骨骼信息中的关节点时空特征生成时空注意力图,将所述时空注意力图作用于视觉图像信息得到增强视觉特征包括:
获取包含T帧的骨骼序列,所述骨骼序列的每一帧包含N个关节点,每个关节点包括二维坐标和置信度信息,所述二维坐标用于表征关节点在图像中的位置;基于相邻帧的二维坐标计算关节点的位移向量;
将所述骨骼序列构建为图结构,所述图结构包括顶点集和边集,顶点集对应骨骼序列中的关节点,边集对应骨骼序列中的骨骼连接;将所述图结构输入至图卷积网络,基于关节点的邻居节点集合对关节点的特征进行增强,得到增强后的关节点特征;对增强后的关节点特征进行多尺度时空特征提取,生成时空位置编码并与时空特征融合得到编码特征,并计算得到时空自注意力特征;对所述时空自注意力特征进行权重融合和约束优化,得到时空注意力图;
基于所述位移向量计算所述时空注意力图中的运动幅度值,所述运动幅度值通过对应位置的位移向量的欧式范数确定;将所述运动幅度值归一化处理得到增强系数,所述增强系数与所述时空注意力图的乘积作用于视觉图像信息以增强目标动作区域的特征表达,得到增强视觉特征。
3.根据权利要求2所述的方法,其特征在于,生成时空注意力图包括:
对所述增强后的关节点特征进行多尺度下采样得到多尺度空间特征图,在预设时间窗口内对所述多尺度空间特征图进行时间卷积运算得到时间动态特征;
生成时空位置编码,将所述时空位置编码与
您可能关注的文档
- CN118434524B 线放电加工机的控制装置及线放电加工机的控制方法 (三菱电机株式会社).docx
- CN118577928B 一种激光多轴联动加工的曲面轮廓解析方法以及机床 (深圳技术大学).docx
- CN118630758B 一种面向气象信息仿真的新能源功率预测方法及系统 (长江三峡集团实业发展(北京)有限公司).docx
- CN118644984B 基于智能警示牌的交通事故告警系统及方法 (浙江安程市政交通设施有限公司).docx
- CN118657456B 基于物联网的物流转运中心智能调度系统和方法 (天津博容包装制品有限公司).docx
- CN118657600B 反跑分实时监测管控方法及系统 (北京榜样在线科技有限公司).docx
- CN118663069B 一种采用咪唑类表面活性剂调控界面聚合制备的高通量耐污染聚酰胺反渗透膜及其制备方法 (天津工业大学).docx
- CN118676882B 一种直流微网自适应下垂控制方法、系统、装置及介质 (华南理工大学).docx
- CN118797844B 一种镰形前刀头立铣刀的镰形刃线确定方法 (哈尔滨理工大学).docx
- CN118920681B 一种数据线供电系统及其控制方法 (深圳市创盈达电子有限公司).docx
- 化妆品公司动力部年度总结.pptx
- 七年级下册(2024)第六单元课外古诗诵读之《约客》课件(共26张PPT).pptx
- 24《寓言四则》优质课教学课件(共15张PPT).ppt
- 七年级下册(2024)第六单元课外古诗诵读之《竹里馆》课件(共26张PPT).pptx
- LIMS供应商概览与技术标书.pdf
- 线缆厂薪酬核算管理规章.doc
- 《课外古诗词诵读——逢入京使 》课件(共22张PPT)2025—2026学年统编版语文七年级下册.pptx
- 《课外古诗词诵读——贾生》课件(共22张PPT)2025—2026学年统编版语文七年级下册.pptx
- 7 谁是最可爱的人 课件 (共20张PPT) 2025-2026学年统编版语文七年级下册.pptx
- 电池厂叠片机配件管理规范规章.doc
最近下载
- 部编版小学三年级下册语文教学工作总结.docx VIP
- 2024-2025学年贵州省遵义市新蒲新区人教版六年级上学期期末教学质量检测数学试卷(无答案).docx
- 一年级看图写话练习大全.docx VIP
- 钢筋混凝土化粪池22S702.pdf VIP
- 《汉唐中医方剂讲解(打印版)》中医书籍.doc VIP
- TCAPC010-2023 药品网络经营质量管理规范.pdf
- BS EN 1610-2015 下水道和下水道的建造和测试.pdf VIP
- 《康师傅品牌定位》课件.ppt VIP
- ian康师傅品牌介绍重点.ppt VIP
- 山东省烟台市莱山区2024-2025学年上学期九年级期末数学试卷(五四学制)(含解析).pdf VIP
原创力文档


文档评论(0)