- 1
- 0
- 约1.6万字
- 约 14页
- 2023-06-09 发布于四川
- 举报
本发明实施例涉及一种视觉声纹辅助的语音分离方法和装置,所述方法包括:对采集到的混合语音数据进行音频处理,得到该混合语音数据的隐层表示;对采集到的目标对象的视频数据进行视频处理,得到该视频数据的隐层表示;所述视频数据与所述混合语音数据在时间维度上对齐;基于所述视频数据的隐层表示,确定目标对象的身份信息;基于所述混合语音数据的隐层表示、视频数据的隐层表示和身份信息,从所述混合语音数据中分离出所述目标对象的语音数据。由此,可以实现混合语音数据中分离出目标对象的语音数据。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113035225 A
(43)申请公布日
2021.06.25
(21)申请号 20191
您可能关注的文档
最近下载
- 2025(人教版)数学六年级下册全册教学设计.docx
- API 682-2014 离心泵和转子泵用轴封系统 第四版(中文).pdf
- 华东师大版八年级数学上册《14.2.3容易误导读者的统计图》同步练习题及答案.docx VIP
- 《从零开始学低压电工技术》,张伯虎,高清版.pdf
- 2026京东智能产发股份有限公司招股说明书.pdf VIP
- 基于交通静化理论的威海市环海路部分路段的优化设计--本科生毕业论文(设计).doc VIP
- 一年级数学20以内破十法减法练习题.pdf VIP
- 一年级数学20以内加减法(凑十法、破十法)专项练习.pdf VIP
- 云南省专业技 职称申报评审表(完整.pdf
- 20以内凑十法专项练习.pdf VIP
原创力文档

文档评论(0)