- 0
- 0
- 约9.62千字
- 约 13页
- 2026-05-25 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119601009A
(43)申请公布日2025.03.11
(21)申请号202411800952.1
(22)申请日2024.12.09
(71)申请人小哆智能科技(北京)有限公司
地址100089北京市海淀区西北旺东路10
号院东区23号楼三层346室
(72)发明人段俊凯
(74)专利代理机构北京维创华成知识产权代理事务所(普通合伙)16094
专利代理师刘冠一
(51)Int.Cl.
G10L15/22(2006.01)
G10L15/24(2013.01)
G10L15/06(2013.01)
G10L19/022(2013.01)
G10L19/02(2013.01)
G10L25/30(2013.01)
G10L25/57(2013.01)
G06N3/0464(2023.01)
G06N3/0895(2023.01)
权利要求书1页说明书5页附图1页
(54)发明名称
一种基于多模态自监督学习的语音与唇动
联合识别方法及系统
(57)摘要
CN119601009A本发明属于人工智能和自然语言处理领域,提供了一种基于多模态自监督学习的语音与唇动联合识别方法及系统,方法包括:待识别语音信号和待识别唇动视频收集和多模态联合识别
您可能关注的文档
- CN119600040A 一种基于跨模态视觉-文本融合的遥感图像分割方法 (中国航空工业集团公司洛阳电光设备研究所).docx
- CN119600041A 一种基于多尺度混合卷积的超声乳腺病灶区自动分割方法 (重庆邮电大学).docx
- CN119600043A 基于改进Swin UNETR网络的脑肿瘤MRI图像分割模型及方法 (安徽工业大学).docx
- CN119600050A 一种基于机器学习的磨削工件边缘形状检测方法及系统 (江苏先进光源技术研究院有限公司).docx
- CN119600056A 定位追踪方法、装置、设备、介质和程序 (北京字跳网络技术有限公司).docx
- CN119600057A 高精度船舶多目标追踪方法、装置、设备及存储介质 (成都辰天信息科技有限公司).docx
- CN119600063A 停车场全景安全监控方法及系统 (深圳市道尔智控科技股份有限公司).docx
- CN119600064A 一种用于公路边坡工程的无人机巡检方法 (西安中交公路岩土工程有限责任公司).docx
- CN119600065A 一种基于双目相机的目标定位和跟踪方法及系统 (苏州显扬机器人有限公司).docx
- CN119600066A 一种伪影图像配准方法、装置、终端设备和存储介质 (武汉联影智融医疗科技有限公司).docx
原创力文档

文档评论(0)