视觉声纹辅助的语音分离方法及装置.pdfVIP

  • 1
  • 0
  • 约1.6万字
  • 约 14页
  • 2023-06-09 发布于四川
  • 举报

视觉声纹辅助的语音分离方法及装置.pdf

本发明实施例涉及一种视觉声纹辅助的语音分离方法和装置,所述方法包括:对采集到的混合语音数据进行音频处理,得到该混合语音数据的隐层表示;对采集到的目标对象的视频数据进行视频处理,得到该视频数据的隐层表示;所述视频数据与所述混合语音数据在时间维度上对齐;基于所述视频数据的隐层表示,确定目标对象的身份信息;基于所述混合语音数据的隐层表示、视频数据的隐层表示和身份信息,从所述混合语音数据中分离出所述目标对象的语音数据。由此,可以实现混合语音数据中分离出目标对象的语音数据。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113035225 A (43)申请公布日 2021.06.25 (21)申请号 20191

文档评论(0)

1亿VIP精品文档

相关文档