CN113571079B 语音增强方法、装置、设备及存储介质 (腾讯科技(深圳)有限公司).docxVIP

  • 0
  • 0
  • 约3.21万字
  • 约 49页
  • 2026-01-20 发布于重庆
  • 举报

CN113571079B 语音增强方法、装置、设备及存储介质 (腾讯科技(深圳)有限公司).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN113571079B

(45)授权公告日2025.07.11

(21)申请号202110171244.6

(22)申请日2021.02.08

(65)同一申请的已公布的文献号申请公布号CN113571079A

(43)申请公布日2021.10.29

(73)专利权人腾讯科技(深圳)有限公司

地址518057广东省深圳市南山区高新区

科技中一路腾讯大厦35层

G10L21/0264(2013.01)

(56)对比文件

CN111554322A,2020.08.18

CN111554323A,2020.08.18

CN111554309A,2020.08.18审查员苏金凤

权利要求书3页说明书17页附图6页

(72)发明人肖玮史裕鹏吴祖榕

王蒙商世东

(74)专利代理机构深圳市联鼎知识产权代理有限公司44232

专利代理师朱黎

(51)Int.CI.

G1OL21/0232(2013.01)

(54)发明名称

语音增强方法、装置、设备及存储介质

(57)摘要

CN113571079B本申请涉及语音处理技术领域,具体提供了一种语音增强方法、装置、设备及存储介质,该包括:根据目标语音帧的频域表示进行声门参数预测,得到目标语音帧对应的声门参数;根据目标语音帧的历史语音帧对应的增益对目标语音帧进行增益预测,得到目标语音帧对应的增益;根据目标语音帧的频域表示进行激励信号预测,得到目标语音帧对应的激励信号;对目标语音帧对应的声门参数、目标语音帧对应的增益和目标语音帧对应的激励信号进行合成处理,得到目标语音帧对应的增强语音信号;本方案可以有效对语

CN113571079B

5n)s(n

5n)

s(n)

P_pre(n)

720

通过第一种经

网络声门

通过第三神经

网络激励

通过第二神经网络预测增益

ar(n)

R(n)

双时爱操一

G(n)

rín)合成滤波s_eln)

CN113571079B权利要求书1/3页

2

1.一种语音增强方法,其特征在于,包括:

根据目标语音帧的频域表示进行声门参数预测,得到所述目标语音帧对应的声门参数;所述目标语音帧是指当前待进行增强处理的语音帧,所进行的声门参数预测是指通过神经网络预测用于重构所述目标语音帧中原始语音信号的声门参数;

根据所述目标语音帧的历史语音帧对应的增益对所述目标语音帧进行增益预测,得到所述目标语音帧对应的增益;所述历史语音帧对应的增益是指用于重构所述历史语音帧中原始语音信号的增益,所述原始语音信号是不包括噪声的语音信号;

根据所述目标语音帧的频域表示进行激励信号预测,得到所述目标语音帧对应的激励信号;

对所述目标语音帧对应的声门参数、所述目标语音帧对应的增益和所述目标语音帧对应的激励信号进行合成处理,得到所述目标语音帧对应的增强语音信号。

2.根据权利要求1所述的方法,其特征在于,所述对所述目标语音帧对应的声门参数、所述目标语音帧对应的增益和所述目标语音帧对应的激励信号进行合成处理,得到所述目标语音帧对应的增强语音信号,包括:

根据所述目标语音帧对应的声门参数构建声门滤波器;

通过所述声门滤波器对所述目标语音帧对应的激励信号进行滤波,得到第一语音信号;

按照所述目标语音帧对应的增益对所述第一语音信号进行放大处理,得到所述目标语音帧对应的增强语音信号。

3.根据权利要求2所述的方法,其特征在于,所述目标语音帧包括多个样本点;所述声门滤波器为K阶滤波器,K为正整数;所述激励信号包括所述目标语音帧中多个样本点分别对应的激励信号值;

所述通过所述声门滤波器对目标语音帧对应的激励信号进行滤波,得到第一语音信号,包括:

将所述目标语音帧中每个样本点的前K个样本点所对应的激励信号值与所述K阶滤波器进行卷积,得到所述目标语音帧中每个样本点的目标信号值;

按照时间顺序组合所述目标语音帧中的全部样本点对应的目标信号值,得到所述第一语音信号。

4.根据权利要求2所述的方法,其特征在于,所述声门滤波器是K阶滤波器,所述声门参数包括K阶线谱频率参数或者K阶线性预测系数;K为正整数。

5.根据权利要求1所述的方法,其特征在于,所述根据目标语音帧的频域表示进行声门参数预测,得到所述目标语音帧对应的声门参数,包括:

将所述目标语音帧的频域表示输入第一神经网络,所述第一神经网络是根据样本语音帧的频域表示和所述样本语音帧对应的声门参数进行训练得到的;

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档