- 0
- 0
- 约2.05万字
- 约 29页
- 2026-01-11 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114974245B(45)授权公告日2025.07.01
(21)申请号202210609847.4
(22)申请日2022.05.31
(65)同一申请的已公布的文献号申请公布号CN114974245A
(43)申请公布日2022.08.30
(73)专利权人南京地平线机器人技术有限公司地址210046江苏省南京市经济技术开发
区兴智科技园A栋20层
(72)发明人胡玉祥朱长宝余凯
(74)专利代理机构北京思源智汇知识产权代理有限公司11657
专利代理师李林莎
G10L21/0216(2013.01)
G10L21/0272(2013.01)
G10L25/27(2013.01)
H04L9/40(2022.01)
GO6T7/00(2017.01)
(56)对比文件
WO2020232867A1,2020.11.26USB1,2019.01.08
审查员宋玉香
(51)Int.CI.
G1OL15/22(2006.01)
G1OL15/25(2013.01)权利要求书2页说明书11页附图3页
(54)发明名称
语音分离方法和装置、电子设备和存储介质
(57)摘要
CN114974245B本公开实施例公开了一种语音分离方法和装置、电子设备和存储介质,其中,该方法包括:获取空间区域内的第一混合语音信号和第一图像序列;对第一图像序列进行图像质量检测,确定第一图像序列的图像质量;响应于第一图像序列的图像质量满足预设标准,利用第一语音分离模型对输入的第一混合语音信号和第一图像序列进行处理,获得第一语音信号;响应于第一图像序列的图像质量不满足预设标准,利用第二语音分离模型对第一混合语音信号进行处理,获得第二语音信号。本公开实施例可以对第一混合语音信号进行语音分离,并可以确定分离后语音信
CN114974245B
获取空间区域内的第一混合语音信号和第一图像序列
对第一图像序列进行图像质量检测,确定第一图像序列的图像质量
响应于第一图像序列的图像质量满足预设标准,利用第一语音分离模型对输入的第一混合语音信号和第一图像序列进行处理,获得第一语音信号
响应于第一图像序列的图像质量不满足预设标准,利用第二语音分离模型对第一混合语音信号进行处理,获得第二语音信号
CN114974245B权利要求书1/2页
2
1.一种语音分离方法,包括:
获取空间区域内的第一混合语音信号和第一图像序列,其中,所述第一混合语音信号包括第一人物的语音信号和第二人物的语音信号,所述第一图像序列为在所述空间区域采集的包括空间内人物的图像序列;
对所述第一图像序列进行图像质量检测,确定所述第一图像序列的图像质量;
响应于所述第一图像序列的图像质量满足预设标准,利用第一语音分离模型对输入的所述第一混合语音信号和所述第一图像序列进行处理,获得第一语音信号,其中,所述第一语音信号包括所述混合语音信号分离出的至少一路语音信号;
响应于所述第一图像序列的图像质量不满足所述预设标准,利用第二语音分离模型对所述第一混合语音信号进行处理,获得第二语音信号,其中,所述第二语音信号包括所述混合语音信号分离出的至少一路语音信号。
2.根据权利要求1所述的语音分离方法,其中,所述对所述第一图像序列进行图像质量检测,确定所述第一图像序列的图像质量,包括:
获取所述第一图像序列对应的图像信号,确定所述图像信号的图像信号质量;
基于所述第一图像序列的各图像帧,确定所述第一图像序列的图像内容质量;
基于所述图像信号质量和所述图像内容质量,确定所述第一图像序列的图像质量。
3.根据权利要求2所述的方法,其中,所述基于所述第一图像序列的各图像帧,确定所述第一图像序列的图像内容质量,包括:
基于所述第一图像序列的各图像帧,确定所述第一人物和/或所述第二人物在所述各图像帧中的唇部遮挡状态;
基于所述唇部遮挡状态,确定所述图像内容质量。
4.根据权利要求3所述的方法,其中,所述基于所述图像信号质量和所述图像内容质量,确定所述第一图像序列的图像质量,包括:
您可能关注的文档
- (正式版)DB3311∕T 238-2023 《 县级社会治理中心建设与管理规范》.pdf
- (正式版)DB3311∕T 239-2023 《 灰树花生产技术规程 》.pdf
- (正式版)DB3311∕T 241-2023 《 地理标志产品 惠明茶 》.pdf
- (正式版)DB3311∕T 242-2023 《 马口鱼人工养殖技术规范》.pdf
- (正式版)DB3311∕T 246-2023 《 生物多样性公众科普示范区建设与评价》.pdf
- (正式版)DB3311∕T 247-2023 《 城市桥梁养护移交规范 》.pdf
- (正式版)DB3311∕T 254-2023 《 化妆品经营单位经营行为评价规范 》.pdf
- (正式版)DB3311∕T 255-2023 《 民生药事服务规范 》.pdf
- (正式版)DB3311∕T 256-2023 《 高山辣椒生产技术规程》.pdf
- (正式版)DB3311∕T 257-2023 《 杨梅山地大棚促成生产技术规程》.pdf
- CN114991790B 一种盾构地下车站切桩的施工方法 (中铁十五局集团城市轨道交通工程有限公司).docx
- CN114993818B 地下工程支护体系综合评价方法及设计方法 (中国矿业大学(北京)).docx
- CN114997613B 一种空间多飞行器多目标协同调度方法 (西北工业大学).docx
- CN115004120B 图像解析装置、控制装置、机械系统、图像解析方法以及图像解析用计算机程序产品 (发那科株式会社).docx
- CN115004646B 终端装置、基站装置及通信方法 (夏普株式会社).docx
- CN115004786B 用于确定移动设备的位置的方法、装置和系统 (华为技术有限公司).docx
- CN115014189B 一种通信铁塔变形自动检测装置及其检测方法 (中通服咨询设计研究院有限公司).docx
- CN115014722B 高温镜片透过率与高温镜片辐射光谱测试平台及测试方法 (桂林理工大学).docx
- CN115018058B 基于简化sdsp算法的轻量级片上学习方法、系统及处理器 (重庆大学).docx
- CN115018700B 一种触觉图像超分辨率重建方法及采集系统 (大连理工大学).docx
最近下载
- 停车场车位租赁协议电子版(六篇).doc VIP
- 1.2 获取数据有方法(教案)四年级全一册信息技术人教版.docx VIP
- 电气安全隐患排查课件.ppt VIP
- 橡胶行业“十五五”规划纲要发布.docx
- 人教版八年级下册语文教案(全册)共85页.doc VIP
- DBJ-T13-498-2025城市黑臭水体整治效果优化评估技术标准.pdf VIP
- 《7号梦工厂》儿童绘本.ppt VIP
- 贝多芬C小调第八钢琴奏鸣曲《悲怆》第三乐章(No.8 Op.13) 高清钢琴谱五线谱.docx VIP
- 高二英语听力模拟试题(附材料和答案).pdf VIP
- 安徽省阜阳市太和县2023-2024学年八年级上学期期末数学试题.pdf VIP
原创力文档

文档评论(0)