视觉声纹辅助的语音分离方法及装置.pdfVIP

下载本文档

1
0
约1.6万字
约 14页
2023-06-09 发布于四川
举报

视觉声纹辅助的语音分离方法及装置.pdf

本发明实施例涉及一种视觉声纹辅助的语音分离方法和装置，所述方法包括：对采集到的混合语音数据进行音频处理，得到该混合语音数据的隐层表示；对采集到的目标对象的视频数据进行视频处理，得到该视频数据的隐层表示；所述视频数据与所述混合语音数据在时间维度上对齐；基于所述视频数据的隐层表示，确定目标对象的身份信息；基于所述混合语音数据的隐层表示、视频数据的隐层表示和身份信息，从所述混合语音数据中分离出所述目标对象的语音数据。由此，可以实现混合语音数据中分离出目标对象的语音数据。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113035225 A (43)申请公布日 2021.06.25 (21)申请号 20191

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

视觉声纹辅助的语音分离方法及装置.pdfVIP

视觉声纹辅助的语音分离方法及装置.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档