语音识别之MFCC特征提取讲稿.pptVIP

下载本文档

70
0
约3.8千字
约 34页
2016-11-25 发布于湖北
举报

语音识别之MFCC特征提取讲稿.ppt

一、声谱图（Spectrogram）一、声谱图（Spectrogram）一、声谱图（Spectrogram）一、声谱图（Spectrogram）一、声谱图（Spectrogram）二、Cepstrum Analysis 峰值表示语音的主要频率成分，我们把这些峰值称为共振峰（formants）共振峰携带了声音的辨识属性（就是个人身份证一样，所以它特别重要）。用它就可以识别不同的声音。如何提取？二、Cepstrum Analysis 语音信号序列时域：x(n)=h(n)*e(n) 频域：X(K)=H(K)E(K) 为了较好地将语音信号中的激励信号和声道响应分离倒谱：log||X[k] ||= log ||H[k] ||+ log ||E[k] || 二、Cepstrum Analysis 慢变化的包络快变化的周期化细致结构二、Cepstrum Analysis 我们需要把这两部分分离开--卷积同态系统二、Cepstrum Analysis Shanghai Jiao Tong University 这里，这段语音被分为很多帧，每帧语音都对应于一个频谱（通过短时FFT计算），频谱表示频率与能量的关系。在实际使用中，频谱图有三种，即线性振幅谱、对数振幅谱、自功率谱（对数振幅谱中各谱线的振幅都作了对数计算，所以其纵坐标的单位是dB（分贝）。这个变

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

语音识别之MFCC特征提取讲稿.pptVIP