CN119723428A 一种音视频多模态识别方法及系统 (济南致业电子有限公司).docxVIP

  • 2
  • 0
  • 约1.47万字
  • 约 25页
  • 2026-06-15 发布于山西
  • 举报

CN119723428A 一种音视频多模态识别方法及系统 (济南致业电子有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119723428A

(43)申请公布日2025.03.28

(21)申请号202510230366.6

(22)申请日2025.02.28

(71)申请人济南致业电子有限公司

地址250101山东省济南市高新区新泺大

街1166号奥盛大厦1号楼1616室

(72)发明人曹永军曹曙晴陈家宝周鹏

(74)专利代理机构山东辰华知识产权代理有限

公司37336

专利代理师刘彩荣

(51)Int.Cl.

G06V20/40(2022.01)

权利要求书3页说明书8页附图2页

(54)发明名称

一种音视频多模态识别方法及系统

(57)摘要

CN119723428A本发明涉及数据处理技术领域,具体涉及一种音视频多模态识别方法及系统,包括:感知层、识别层、指示层;采集设备运行采集的视频数据实时向感知层中上传,感知层同步感知采集设备姿态,基于采集的视频及采集设备姿态锁定追踪目标,同步提取追踪目标特征参数,识别层进一步接收感知层中提取的追踪目标特征参数,同步控制感知层再次运行锁定追踪目标,本发明以采集设备为主体对采集设备采集的视频数据进行处理,于视频数据中获取追踪目标,并以指定的反复锁定逻辑最终确定明确的追踪目标,进一步以帧级图像处理及分析技术,对追踪目标进行持续的追踪,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档