- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理中基于加权自相关函数的基音提取
语音信号处理中基于加权自相关函数的基音提取中文摘要在语音信号处理中,很难去确定准确的基频。为了解决这个问题,本文提出基于自相关函数的加权基音检测法。首先,因为平均幅度差函数的方法与自相关函数有相同的性质,根据自相关函数,我们用平均幅度差函数倒数的平方作为权重系数。最后,我们获取一个基音提取的新算法。此外,基音平滑处理是为了获取更好的效果。仿真实验结果显示这个新的算法可以进行基音检测。此外,它也提高了基音检测的精确度。关键字——语音信号处理 基音检测 加权自相关函数 平均幅度差函数基音是一个谐波信号中的基频。基音段在语音处理中扮演着一个重要的角色。一般来说,音调分类是根据基音曲线;基于波形拼接的语音合成需要对基音轨迹修改;汉语言识别系统使用基音轨迹来识别语音,这对于消除歧义来说很重要;音调周期在文本语言合成中也起着关键作用。音调检测的目的是找到与声带振动一致地的基音段曲线。基音段的精度和实时性在语音信号处理中是非常重要的。为此,已经提出了许多提取语音信号基音的方法,诸如短期自相关函数,短时平均幅度差函数,谱距离法,端点检测等等。这些基音提取方法基于语音信号短时间平稳性。为此,准确和有效的基音提取功能,其预处理以及用于基音检测的平滑处理是精确基音检测的关键。为了降低信噪比,[2]提出了一种ACF来提取噪声信号的基音。[3]提出了一种利用三个功率的振幅谱代替传统的二次幂的噪声信号的鲁棒基音检测算法,以通过带通滤波器调整语音频谱。[4]提出了一种基于反向滤波的AR模型,以降低噪声信号的检测误差。[5]使用形态滤波器去除语音信号预处理中的噪声,然后通过小波变换方法检测音调频率,提高了基音检测的鲁棒性。[6]提出了一种基于AMDF的算法来基音检测。 [7]使用短期能量通过判断声音/无声段来检测基音主体。大多数基音估计算法仅使用AMDF或ACF来检测基音周期,但是存在大量的干扰波。考虑在AMDF和ACF中出现在相同时间的极值,提出了一种使用由AMDF加权的自相关函数的新的基音提取方法。与ACF或AMDF相反,该方法减少有效地干扰波,这提高了噪声环境中的基音检测的精度。自相关函数1.1短时自相关函数计算公式: (1-1)? ?:窗长; :加窗语音信号语音有两种:浊音和清音。浊音信号的自相关函数具有基频的倍数的峰值,而清音信号没有。因此,可以通过计算相邻峰值位置的距离来估计基音周期。 图1显示了用自相关函数的音调检测过程。图1.1:ACF的音调检测程序根据图1.1,我们可以估计音调周期通过以下步骤:获取语音信号; b)通过预处理获得固定语音段; c) 剪切静止语音,消除共振峰的干扰; d)通过自相关在基频的倍数中得到语音信号的峰值; e)通过峰值估计语音信号的音调周期平均误差函数2.1平均幅度差函数计算公式: (2-1)与声信号具有相同的周期性质,但它具有基频的倍数的波谷而不是波峰。AMDF算法具有与ACF估计基音周期的类似过程,不同之处在于AMDF使用波谷,而ACF使用波峰。 图2.1显示了AMDF估计基音周期的过程。音调周期估计短时平均幅度计算切割波处理帧,终点检测输入语音信号图2.1:AMDF的音调检测程序三、加权自相关函数ACF和AMDF都将出现基频的极值,所以我们可以利用这个特征来提取基频。为了强调ACF产生的真正的峰值,我们提出了一个自相关函数,用AMDF的权重系数的倒数的平方加权。图3.1示出了通过加权ACF估计基音周期的过程。图3.1:通过加权ACF的音调检测过程我们的方法是基于由AMDF的倒数平方加权的ACF。 考虑到具有基频谷值现象的AMDF,因此它的倒数将出现相反的特征,即AMDF将具有基频的倍数的峰值特征。我们的方法是基于通过AMDF的倒数平方加权的ACF。考虑到在基频的倍数具有谷值的AMDF,因此其倒数将呈现相反的特征,并且AMDF将具有在基频的倍数中的峰值。为此,我们使用AMDF的倒数平方来加强ACF的峰值。乘以ACF和AMDF的平方的倒数将产生更强的极值,这将有助于提高音调检测的精度。通过加权ACF估计音调的音调周期的过程如下:去噪预处理大多数情况下,语音信号中存在很多噪声和谐振频率,这使得语音信号波形变得复杂,并且对基音检测带来很多困难。因此,在提取基音周期之前需要进行去噪预处理。语音信号包含丰富的谐波分量,最高谐波频率可以达到5000Hz,因此我们可以使用通频带为900Hz的线性相位低通滤波器滤除高频噪声和高次谐波分量。分帧和端点检测通过矩形窗(窗口长度至少是基音周期的两倍)来加权语音信号,以便分割语音信号。然后检
文档评论(0)