- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基音是指浊音时声带振动所引起的周期,基音周期是指声带振动频率的倒数。
基音提取的主要困难:
(1)声门激励信号并不是一个完全周期的序列
(2)声门共振峰有时会影响激励信号的谐波结构
(3)语音信号是准周期的,受共振峰结构、噪声的影响。
(4)基音周期变化范围大
为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。
此算法比较适合于噪声环境下的基音提取。但通常情况下基音频率大于基音周期的自相关峰时,单独使用自相关函数会导致半倍和双倍基音的提取误差。
自相关函数提供了一种获取周期信号周期的方法。在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具。
语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数。短时自相关函数是在信号的第N个样本点附近用短时窗截取一段信号,做自相关计算。
短时自相关函数有以下重要性质:
①如果{s(n)}是周期信号,周期是P,则R(?)也是周期信号,且周期相同,即R(?)=R(P+?)。
②当τ=0时,自相关函数具有最大值;当τ=0+p+2P+3P+…处周期信号的自相关函数达到极大值。
③自相关函数是偶函数,即R(?)=R(-?)。
短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。 在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,语音信号移动,这是经典的短时自相关函数法。窗口长度N的选择至少要大于基音周期的两倍,N越大,短时自相关函数波形的细节就越清楚,更有利于基音检测,但计算量较大,近年来由于高速数字信号处理器(DSP)的使用,从而使得这一算法简单有效,而不再采用结构复杂的快速傅里叶变换法、递归计算法等; N越小,误差越大,但计算量较小。
自相关函数在基音周期处表现为峰值, 这些峰值点之间的间隔的平均值就是基音周期
平均幅度差函数法(AMDF)
语音信号的短时平均幅度差函数Fn(k)与短时自相关函数一样,对周期性的浊音一样,Fn(k)也呈现与浊音语音周期一致的周期特性,不过不同的是Fn(k)在周期的各个整数倍点上具有是谷值特性而不是峰值特性,因而通过Fn(k)的计算同样可以确定基音周期。与短时自相关函数一样,对周期性的浊音一样,Fn(k)也呈现与浊音语音周期一致的周期特性,不过不同的是Fn(k)在周期的各个整数倍点上具有是谷值特性而不是峰值特性,因而通过Fn(k)的计算同样可以确定基音周期。
1.由于函数中只需加法、减法和取绝对值等计算,因此算法很简单,易于硬件实现,从而使得短时平均幅度差函数法在基音检测中使用得相当普遍;
2.研究表明,当语音信号的变化比较平缓时,ADMF法进行基音周期估计可以得到较高的估计,即精度和可靠性,所需计算量比较小,但是当语音信号的幅度或频率变化比较快时,AMDF法的基音估计精度会明显下降。噪音对AMDF法的影响很大,鲁棒(Robust)性(“抗变换性”)较差。
短时AMDF函数随着滞后时间的增加,峰值幅度逐渐下降,这使得谷值点检测以及谷值点的清晰度检查比较困难。
加权平均幅度差函数(AMDF)
但是短时自相关函数法也存在以下缺点:
①倍频现象
通常情况下,基波分量往往不是最强的分量,丰富的谐波成分使语音信号的波形变得非常 复杂,给基音检测带来了困难,经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况。加之还有清浊混杂等情况,使基音检测成为一大难题。
如图5 ( a)是一帧语音信号,图4 ( b)是这帧语音信号的自相关函数,可以看出自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,如图6 ( b)所示可以看出自相关函数检测出的基音周期是原始信号基音周期的一半,这是由于谐波峰值点(箭头所示)的影响,这就是上述缺点中所说的倍频现象。
②运算量大,效率低下
无论是对随机的语音信号还是对离散的信号进行处理,只要是使用自相关函数对信号进行周期估计,必然涉及大量的乘法运算。虽然经过实验证明,自相关函数法是一种简单而且有效的方法,但是大量的乘法运算严重影响算法的效率。然而从估计基音周期的角度看,短时自相关函数所包含的信息许多是多余的,真正能反映基音周期性的只是少数几个峰,而其余的大多数峰都是由于声道的谐振特性引起的。为此,可以用三电平削波法来突现反映基音周期的信息,同时压缩与共无关的信息。三电平法具体的方法就不在此详细
文档评论(0)