第三讲语音信号处理第3.1~3.4章课件.ppt

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲语音信号处理第3.1~3.4章课件

倒谱分析实例:MEL频率倒谱参数(MFCC) MFCC(Mel-Frequency Cepstral Coefficents MFCC) 分析着眼于人耳的听觉特性,因为,人耳所听到的声音的高低与声音的频率并不成线性正比关系,而用Mel频率尺度则更符合人耳的听觉特性。所谓Mel频率尺度,它的值大体上对应于实际频率的对数分布关系。Mel频率与实际频率的具体关系 MFCC的计算方法 FFT LPC变换法 中心频率f(m)可以用下面的方法定义: 其中 、 为滤波器的频率应用范围的最低频率和最高频率, N为DFT(或FFT)窗宽, 为采样频率,而 为B的逆函数: 梅尔滤波器组的中心频率 当m值小时,相邻f(m)之间的间隔也小,随着m的增加 , f(m)的间隔逐渐变大,这些中心频率在线性频域是非线性划分的,但是转换到Mel频谱域则是均匀划分的。 Mel频率滤波器组即为在语音的频谱范围内设置的若干个带通滤波器 M为滤波器的个数。每个滤波器具有三角滤波特性,其中心频率为f(m), 每个带通滤波器的传递函数为: 梅尔滤波器组的传递函数 梅尔频率倒谱系数 人的听觉系统是一个特殊的非线性系统,它响应不同频率信号的灵敏度是不同的。在语音特征的提取上,人类听觉系统做得非常好,它不仅能提取出语义信息, 而且能提取出说话人的个人特征,这些都是现有的语音识别系统所望尘莫及的。如果在语音识别系统中能模拟人类听觉感知处理特点, 就有可能提高语音的识别率。 MFCC 考虑到了人类的听觉特征,先将线性频谱映射到基于听觉感知的Mel非线性频谱中,然后转换到倒谱上。 MFCC参数具有良好的识别性能和抗噪能力 使用的最广泛的特征之一 考虑了人耳的听觉生理特征 在语音识别中,相比于LPC系数、PARCOR系数,MFCC有更强的鲁棒性和可靠性 MFCC的应用 MFCC 的定义 求MFCC流程 输入语音 预加重、分帧和加窗 FFT (Fast Fourier transform) 取绝对值或平方值 Mel滤波 取对数 DCT (Discrete cosine transform) 输出特征向量 √ √ √ √ 动态特征(Delta MFCC) √ 原始语音信号经过预加重、分帧和加窗处理后,需要将时域信号变换到频域。 常用的变换方法为 “傅立叶变换(DFT)”或者其快速算法“快速傅里叶变换(FFT)” 在实际应用中,常常通过FFT(蝶形算法)进行时域到频域的变换 求MFCC---FFT 将上述线性频谱利用前面提到的Mel滤波器组进行Mel滤波 Mel滤波器组 则有线性频谱到对数频谱的中传递函数为: 求MFCC:Mel滤波 取对数 同态变换(同态滤波) :实现将卷积关系和乘积关系变换为求和关系的分离处理,将非线性信号处理变为线性信号处理的过程。 语音信号x(n)可视为声门激励信息u(n)及声道脉冲响应h(n)的卷积:x(n)=u(n)*h(n)。某些信道(录音设备)也可视为与语音信号作卷积运算。有必要将语音信号的声门激励信息、声道响应信息、信道信息由卷积关系变为线性关系,从而利用其它方法提取出基音周期、声道特性和信道特性。 对卷积信号 作如下变换: 取对数 求MFCC 取对数:对三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。 倒谱(cepstrum):一种信号的傅里叶变换经对数运算后再进行傅里叶反变换得到的谱。 倒谱的计算过程: DFT ln|·| 逆DFT 时域信号 信号频谱 对数谱 倒谱 取对数 求MFCC 由于各个滤波器组输出的幅度或能量之间具有很强的相关性,因此有必要去除各维信号之间的相关性,并将信号映射到低维空间。(如HMM中,假设各维特征独立,以使用对角协方差矩阵,从而减小计算量) 在MFCC中,对滤波器组的输出使用了离散余弦变换(DCT)来去除相关性并获得倒谱系数c(n): 当n=0时,c(0)为第0阶MFCC,反应频谱能量 DCT (Discrete cosine transform) 求MFCC 参数转换公式 MFCC---LPC转换法 矩形窗:分辨率高,但第一旁瓣衰减很小,具有较大的上下冲 汉明窗:在频率范围内分辨率较高,旁瓣的衰减大,频谱泄漏少。 短时平均幅度差函数 计算自相关函数的运算量很大,其原因是乘法运算所需要的时间较长。利用快速傅里叶变换(FFT)等简化计算方法都无法避免乘法运算。为了避免乘法,一个简单的方法就是利用差值。为此常常采用另一种与自相关函数有类似作用的参量,即短时平均幅度差函数(AMDF)。 平均幅度差函数能够代替自相关函数进行语音分析,是基于这样一个事实:如果信号是完全的周期信号(设周期为Np),则相距为周期的整数倍的样点上的幅值是相等的,差值为零。 短时平均幅度差函数 对于实

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档