语音识别之MFCC特征提取讲稿.pptVIP

  • 70
  • 0
  • 约3.8千字
  • 约 34页
  • 2016-11-25 发布于湖北
  • 举报
一、声谱图(Spectrogram) 一、声谱图(Spectrogram) 一、声谱图(Spectrogram) 一、声谱图(Spectrogram) 一、声谱图(Spectrogram) 二、Cepstrum Analysis 峰值表示语音的主要频率成分,我们把这些峰值称为共振峰(formants) 共振峰携带了声音的辨识属性(就是个人身份证一样,所以它特别重要)。用它就可以识别不同的声音。 如何提取? 二、Cepstrum Analysis 语音信号序列 时域:x(n)=h(n)*e(n) 频域:X(K)=H(K)E(K) 为了较好地将语音信号中的激励信号和声道响应分离 倒谱:log||X[k] ||= log ||H[k] ||+ log ||E[k] || 二、Cepstrum Analysis 慢变化的包络 快变化的周期化细致结构 二、Cepstrum Analysis 我们需要把这两部分分离开--卷积同态系统 二、Cepstrum Analysis Shanghai Jiao Tong University 这里,这段语音被分为很多帧,每帧语音都对应于一个频谱(通过短时FFT计算),频谱表示频率与能量的关系。在实际使用中,频谱图有三种,即线性振幅谱、对数振幅谱、自功率谱(对数振幅谱中各谱线的振幅都作了对数计算,所以其纵坐标的单位是dB(分贝)。这个变

文档评论(0)

1亿VIP精品文档

相关文档