- 2
- 0
- 约1.47万字
- 约 25页
- 2026-06-15 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119723428A
(43)申请公布日2025.03.28
(21)申请号202510230366.6
(22)申请日2025.02.28
(71)申请人济南致业电子有限公司
地址250101山东省济南市高新区新泺大
街1166号奥盛大厦1号楼1616室
(72)发明人曹永军曹曙晴陈家宝周鹏
(74)专利代理机构山东辰华知识产权代理有限
公司37336
专利代理师刘彩荣
(51)Int.Cl.
G06V20/40(2022.01)
权利要求书3页说明书8页附图2页
(54)发明名称
一种音视频多模态识别方法及系统
(57)摘要
CN119723428A本发明涉及数据处理技术领域,具体涉及一种音视频多模态识别方法及系统,包括:感知层、识别层、指示层;采集设备运行采集的视频数据实时向感知层中上传,感知层同步感知采集设备姿态,基于采集的视频及采集设备姿态锁定追踪目标,同步提取追踪目标特征参数,识别层进一步接收感知层中提取的追踪目标特征参数,同步控制感知层再次运行锁定追踪目标,本发明以采集设备为主体对采集设备采集的视频数据进行处理,于视频数据中获取追踪目标,并以指定的反复锁定逻辑最终确定明确的追踪目标,进一步以帧级图像处理及分析技术,对追踪目标进行持续的追踪,
您可能关注的文档
- CN119723124A 电子产品的风险检测方法和风险检测设备 (清华大学).docx
- CN119723125A 一种商品图像识别结果去重方法及系统 (南京掌控网络科技有限公司).docx
- CN119723134A 一种基于多视图聚类的红外和可见光图像数据关联方法 (电子科技大学(深圳)高等研究院).docx
- CN119723171A 基于物种分类树的野生动物监测图像层次化分类方法 (北京林业大学).docx
- CN119723177A 基于联邦学习的设备故障预测方法 (吉林师范大学).docx
- CN119723179A 基于自适应多标签识别的糖尿病视网膜病变病灶检测方法 (太原理工大学).docx
- CN119723183A 一种基于属性引导的遥感图像场景分类方法 (内蒙古工业大学).docx
- CN119723191A 一种基于音视频流的设备异常行为识别方法及系统 (国网山东省电力公司莱芜供电公司).docx
- CN119723200A 缺陷类型的检测方法和装置、电子设备及存储介质 (苏州镁伽科技有限公司).docx
- CN119723203A 一种基于多实例学习的肿瘤放疗反应预测方法及系统 (同济大学).docx
原创力文档

文档评论(0)