- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
倒谱(CEP)法 倒谱峰在过渡音和含噪语音中将变得不清晰甚至完全消失 过渡音中周期激励信号能量降低和类噪激励信号干扰或含噪语音中的噪声干扰所致。 典型浊音语音的倒谱,其倒谱域中基音信息与声道信息并不是完全分离的,在周期激励信号能量较低的情况下,声道响应(特别是其共振峰)对基音倒谱峰的影响就不可忽略。 如果设法除去语音信号中的声道响应信息,对类噪激励和噪声加以适当抑制,倒谱基音检测算法的检测结果将有所改善,特别对过渡语音的检测结果将有明显改善。 简化逆滤波法(SIFT) 简化逆滤波跟踪(SIFT)的基本思想是: 语音信号进行LPC分析和逆滤波,获得语音信号的预测残差, 残差信号通过自相关滤波器滤波,再作峰值检测,进而获得基音周期。 预测误差是自相关器的输入,通过与门限的比较可以确定浊音,通过辅助信息可以减少误差。 简化逆滤波法(SIFT) 其工作过程为: 语音信号经过10kHz取样后,通过0-900Hz的数字低通滤波,其目的是滤除声道谱中声道响应部分的影响,使峰值检测更加容易。然后降低取样率5倍(因为激励序列的宽度小于1 kHz,所以用2kHz取样就足够了);当然,后面要进行内插。 提取降低取样率后的信号模型参数(LPC参数),检测出峰值及其位置就得到基音周期值。 最后进行有/无声判别。此处与倒谱法类似,有一个无声检测器,以减少运算量。 简化逆滤波法(SIFT) 小波变换法 一个信号的小波变换具有这样的性质: 信号小波变换的极值点对应于信号的锐变点或不连续点。 浊音语是由气流冲击声门,使声门发生周期性的开启或闭合。声门的这种开启与闭合,在语音信号中引起一个锐变。对语音信号作小波变换则其极值点对应于声门的开启或闭合点,相邻极值点之距离就对应着基音周期。 小波变换法 基音检测的后处理 无论采用哪一种基音检测算法都可能产生基音检测错误,使求得的基音周期轨迹中有一个或几个基音周期估值偏离了正常轨迹(通常是偏离到正常值的2倍或1/2),并称这种偏离点为基音轨迹的“野点”。 基音检测的后处理 为了去除野点,采用平滑算法,其中最常用的是中值平滑算法和线性平滑算法。 1.中值平滑处理 在n0点的左右各取L个样点,共同构成一组信号采样值(共(2L+1)个样值),然后将这(2L+1)个样值按大小次序排成一队,取此队列中的中间者作为平滑器的输出。L值一般取为1或2,即中值平滑的“窗口”一般套住3或5个样值,称为3点或5点中值平滑。中值平滑的优点是既可以有效地去除少量的野点,又不会破坏基音周期轨迹中两个平滑段之间的阶跃性变化。 基音检测的后处理 2.线性平滑处理 线性平滑是用滑动窗进行线性滤波处理,即: 其中{ω(m),m = -L,-L+1,…,0,1,2,…,L}为2L+1点平滑窗,满足: 例如三点窗的权值可取为{0.25,0.5,0.25}。线性平滑在纠正输入信号中不平滑处样点值的同时,也使附近各样点的值做了修改。所以窗的长度加大虽然可以增强平滑的效果,但是也可能导致两个平滑段之间阶跃的模糊程度加重。以上两种平滑技术可以结合起来使用。 基音检测的后处理 3.组合平滑处理 为了改善平滑的效果可以将两个中值平滑串接,图3-29a所示是将一个5点中值平滑和一个3点中值平滑串接.另一种方法是将中值平滑和线性平滑组合,如图3-29b所示。为了使平滑的基音轨迹更贴近,还可以采用二次平滑的算法,全部算法的框图如图3-29c所示。由于中值平滑和线性平滑都会引入延时,所以在实现上述方案时应考虑到它的影响。3-29d是一个采用裣延时的可实现二次平滑方案。其中的延时大小可由中值平滑的点数和线性平滑的点数来决定。 基音检测的后处理 3.组合平滑处理 3.6 共振峰估计 当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰参数包括共振峰频率和频带宽度,它是区别不同韵母的重要参数。 共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。 3.6 共振峰估计 基本方法: 带通滤波器 倒谱 LPC法 带通滤波器组法 这是共振峰提取的最早形式,与线性预测法相比,可以使估计的共振峰频率同人耳的灵敏度相匹配,其匹配的程度比线性预测法要好。 滤波器的中心频率有两种分布方法: 一种是等间距地分布在分析频段上,则所有带通滤波器的带宽可设计成相同,从而保证了各通道的群延时相同。 另一种是非均匀地分布,例如为了获得类似于人耳的频率分辨特性,在低频端间距小,高频端间距大,带宽也随之增加。 带通滤波器组法 倒谱法 利用离散傅里叶变换DFT可以求解共振峰参数,但DFT谱受基频谐波的影响,最大值只出现在谐波频率上,因而共振峰测定误差较大。 可采用同态解卷技术,
文档评论(0)