语音信号处理第6讲.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
简化逆滤波法(SIFT) 简化逆滤波器的原理框图如图所示。其工作过程为: 语音信号经过8kHz取样后,通过0-900Hz的数字低通滤器,其目的是滤除声道谱中声道响应部分的影响,使峰值检测更加容易。 然后降低取样率为原来的1/4(因为激励序列的宽度小于1 kHz,所以用2kHz取样就足够了) 提取降低取样率后的信号模型参数(LPC参数) 内插提高采样率,恢复到8kHz 检测出峰值及其位置就得到基音周期值。 一帧语音信号 低通/带通滤波 4:1降采样 LPC分析 逆滤波求预测误差 计算预测误差自相关函数 1:4曾采样 峰值检测 基音周期值 基音检测的后处理 无论采用哪一种基音检测算法都可能产生基音检测错误,使求得的基音周期轨迹中有一个或几个基音周期估值偏离了正常轨迹(通常是偏离到正常值的2倍或1/2),此情况如图所示。并称这种偏离点为基音轨迹的“野点”。 基音周期轨迹以及轨迹中的“野点” 为了去除这些野点,可以采用各种平滑算法,其中最常用的是中值平滑算 法和线性平滑算法。 1.中值平滑处理 中值平滑处理的基本原理是:设x(n)为输入信号,y(n)为中值滤波器的输出,采用一滑动窗,则n0处的输出值y(n0)就是将窗的中心移到n0处时窗内输入样点的中值。即在n0点的左右各取L个样点。连同被平滑点共同构成一组信号采样值(共(2L+1)个样值),然后将这(2L+1)个样值按大小次序排成一队,取此队列中的中间者作为平滑器的输出。 L值一般取为1或2,即中值平滑的“窗口”一般套住3或5个样值,称为3点或5点中值平滑。 中值平滑的优点是既可以有效地去除少量的野点,又不会破坏基音周期轨迹中两个平滑段之间的阶跃性变化。 2.线性平滑处理 线性平滑是用滑动窗进行线性滤波处理,即: 其中{ω(m),m = -L,-L+1,…,0,1,2,…,L}为2L+1点平滑窗,满足: 例如三点窗的权值可取为{0.25,0.5,0.25}。线性平滑在纠正输入信号中不平滑处样点值的同时,也使附近各样点的值做了修改。所以窗的长度加大虽然可以增强平滑的效果,但是也可能导致两个平滑段之间阶跃的模糊程度加重。 为了改善平滑的效果,可以将中值平滑处理和线性平滑处理两种平滑技术结合起来使用。 3.组合平滑处理 为了改善平滑的效果可以将两个中值平滑串接,图a所示是将一个5点中值平滑和一个3点中值平滑串接.另一种方法是将中值平滑和线性平滑组合,如图b所示。为了使平滑的基音轨迹更贴近,还可以采用二次平滑的算法,全部算法的框图如图所示。由于中值平滑和线性平滑都会引入延时,所以在实现上述方案时应考虑到它的影响。d是一个采用裣延时的可实现二次平滑方案。其中的延时大小可由中值平滑的点数和线性平滑的点数来决定。 声道可以看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 共振峰参数包括共振峰频率和频带宽度,它是区别不同韵母的重要参数。共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。 提取共振峰特性最简便的手段是使用语谱仪。分析共振峰参数也可采用数字信号处理的方法,它可获得与语谱图相同的信息。但精确的共振峰估值是很困难的(原因:虚假峰值、共振峰合并、高音调语音)为此,下面讨论常用的几种解决方法。 带通滤波器组法 这种方法类似于语谱仪,但由于使用了计算机,使滤波器特性的选取更具灵活性,实现框图如图所示。 这是共振峰提取的最早形式,与线性预测法相比,滤波器组法有些逊色。 但通过滤波器组的设计可以使估计的共振峰频率同人耳的灵敏度相匹配,其匹配的程度比线性预测法要好。 带通滤波器组法提取共振峰 带通滤波器组法 滤波器的中心频率有两种分布方法: 等间距地分布在分析频段上,则所有带通滤波器的带宽可设计成相同,从而保证了各通道的群延时相同。 是非均匀地分布,例如为了获得类似于人耳的频率分辨特性,在低频端间距小,高频端间距大,带宽也随之增加,这时滤波器的阶数必须设计成与带宽成正比,使得它们输出的群延时相同,不会产生波形失真。 缺点: 由于滤波器组中的滤波器数目有限,估计的共振峰频率不可避免地存在误差; 而且对共振峰带宽不易确定; 由于无法去除声门激励的影响,可能会造成虚假峰值。 倒谱法 共振峰估计虽然可以直接对语音信号求离散傅里叶变换(DFT),通过DFT谱来提取信号的共振峰参数,但是,直接DFT的谱要爱基频谐波的影响,最大值只能出现在谐波频率上,因而共振峰测定误差较大。 为了消除基频谐波的影响,可以采用同态解卷技术,经过同态滤波后得到平滑的谱,这样简单地检测峰值就可以直接提取共振峰参数,这

文档评论(0)

2232文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档