声音识别基础知识重点分析.pptVIP

  • 6
  • 0
  • 约1.58千字
  • 约 15页
  • 2017-05-13 发布于湖北
  • 举报
声音识别基础知识 2015级电子与通信工程 董雪 声音识别原理 语音输入 训练 识别 结果 声音识别的过程 声音的预处理:振幅归一化、预加重、样本分割、加窗 特征提取:特征参数可以是能量、基音频率、共振峰值等,较常见的是线性预测倒谱系数LPCC、Mel倒谱系数MFCC。二者均为将声音信号变换到倒谱域上。 幅值归一化 幅值归一化就是把每一个采样值除以本段信号的幅值。即: 其中, 是原始信号, 是归一化后的信号,n是信号长度。 预加重处理 目的:对高频部分进行加重,增加语音的高频分辨率。 实现方式:一般通过传递函数 的一阶FIR高通数字滤波器来实 现预加重,其中, 为预加重系 数,其值介于0.9到1.0之间。 加窗处理 预加重处理后,进行加窗分帧处理。 原理:由于发声器官的惯性运动,可以认为在一小段时间内(一般为10~30ms)语音信号近似不变,即语音信号具有平稳性。这样,可以把语音信号分为一些短段(分析帧)。语音信号的分帧是采用可移动的有限长度窗口进行加权的方法实现。一般每秒33~100帧。 加窗处理 虽采用连续分段,但一般采用交叠分段 的方法使帧与帧之间平滑过渡,保持连

文档评论(0)

1亿VIP精品文档

相关文档