CN119601009A 一种基于多模态自监督学习的语音与唇动联合识别方法及系统 (小哆智能科技(北京)有限公司).docxVIP

  • 0
  • 0
  • 约9.62千字
  • 约 13页
  • 2026-05-25 发布于山西
  • 举报

CN119601009A 一种基于多模态自监督学习的语音与唇动联合识别方法及系统 (小哆智能科技(北京)有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119601009A

(43)申请公布日2025.03.11

(21)申请号202411800952.1

(22)申请日2024.12.09

(71)申请人小哆智能科技(北京)有限公司

地址100089北京市海淀区西北旺东路10

号院东区23号楼三层346室

(72)发明人段俊凯

(74)专利代理机构北京维创华成知识产权代理事务所(普通合伙)16094

专利代理师刘冠一

(51)Int.Cl.

G10L15/22(2006.01)

G10L15/24(2013.01)

G10L15/06(2013.01)

G10L19/022(2013.01)

G10L19/02(2013.01)

G10L25/30(2013.01)

G10L25/57(2013.01)

G06N3/0464(2023.01)

G06N3/0895(2023.01)

权利要求书1页说明书5页附图1页

(54)发明名称

一种基于多模态自监督学习的语音与唇动

联合识别方法及系统

(57)摘要

CN119601009A本发明属于人工智能和自然语言处理领域,提供了一种基于多模态自监督学习的语音与唇动联合识别方法及系统,方法包括:待识别语音信号和待识别唇动视频收集和多模态联合识别

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档