CN110459240A 基于卷积神经网络和深度聚类的多说话人语音分离方法 (新疆大学).docxVIP

  • 2
  • 0
  • 约1.71万字
  • 约 22页
  • 2026-05-07 发布于山西
  • 举报

CN110459240A 基于卷积神经网络和深度聚类的多说话人语音分离方法 (新疆大学).docx

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号CN110459240A

(43)申请公布日2019.11.15

(21)申请号201910741435.4

(22)申请日2019.08.12

(71)申请人新疆大学

地址830011新疆维吾尔自治区乌鲁木齐

市胜利路666号

(72)发明人董兴磊胡英黄浩

(74)专利代理机构天津市北洋有限责任专利代理事务所12201

代理人李林娟

(51)Int.Cl.

G10L21/028(2013.01)

G10L21/0208(2013.01)

G10L25/30(2013.01)

G06K9/62(2006.01)

G06N3/04(2006.01)

权利要求书1页说明书9页附图2页

(54)发明名称

基于卷积神经网络和深度聚类的多说话人

语音分离方法

(57)摘要

CN110459240A本发明公开了一种基于卷积神经网络和深度聚类的多说话人语音分离方法,包括:一、训练阶段:将单通道多说话人混合语音和对应的单说话人语音分别进行分帧、加窗、短时傅里叶变换;将混合语音幅度频谱和单说话人语音幅度频谱作为神经网络模型的输入进行训练;二、测试阶段:将混合语音幅度频谱作为门限扩张卷积深度聚类模型的输入,得到混合频谱中每一个时频单元的高维嵌入向量;用K-means

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档