CN119649825A 语音分离方法、模型、计算机设备和存储介质 (大众问问(北京)信息科技有限公司).docxVIP

  • 2
  • 0
  • 约2.11万字
  • 约 31页
  • 2026-06-05 发布于山西
  • 举报

CN119649825A 语音分离方法、模型、计算机设备和存储介质 (大众问问(北京)信息科技有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119649825A

(43)申请公布日2025.03.18

(21)申请号202311192586.1

(22)申请日2023.09.15

(71)申请人大众问问(北京)信息科技有限公司

地址100098北京市海淀区大钟寺东路9号

京仪科技大厦D座3层

(72)发明人谭应伟丁雪枫张人杰

(74)专利代理机构北京市万慧达律师事务所11111

专利代理师侯岳

(51)Int.Cl.

G10L19/008(2013.01)

G10L21/0308(2013.01)

G10L25/06(2013.01)

G10L25/30(2013.01)

权利要求书2页说明书11页附图3页

(54)发明名称

语音分离方法、模型、计算机设备和存储介

(57)摘要

CN119649825A本申请涉及一种语音分离方法、模型、计算机设备和存储介质。该方法包括:获取多通道音频采样数据;将多通道音频采样数据输入编码器进行编码处理,得到与多通道音频采样数据对应的二维时频表达数据;将二维时频表达数据输入图卷积神经网络以进行空间特征提取,得到与二维时频表达数据对应的空间特征数据;将空间特征数据输入时频掩码网络进行时频掩码处理,得到各说话人声源分别对应的时频掩码数据;将各说话人声源分别

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档