声音识别基础知识重点分析.pptVIP

下载本文档

6
0
约1.58千字
约 15页
2017-05-13 发布于湖北
举报

声音识别基础知识重点分析.ppt

声音识别基础知识 2015级电子与通信工程董雪声音识别原理语音输入训练识别结果声音识别的过程声音的预处理：振幅归一化、预加重、样本分割、加窗特征提取：特征参数可以是能量、基音频率、共振峰值等，较常见的是线性预测倒谱系数LPCC、Mel倒谱系数MFCC。二者均为将声音信号变换到倒谱域上。幅值归一化幅值归一化就是把每一个采样值除以本段信号的幅值。即：其中，是原始信号，是归一化后的信号，n是信号长度。预加重处理目的：对高频部分进行加重，增加语音的高频分辨率。实现方式：一般通过传递函数的一阶FIR高通数字滤波器来实现预加重，其中，为预加重系数，其值介于0.9到1.0之间。加窗处理预加重处理后，进行加窗分帧处理。原理：由于发声器官的惯性运动，可以认为在一小段时间内（一般为10~30ms）语音信号近似不变，即语音信号具有平稳性。这样，可以把语音信号分为一些短段（分析帧）。语音信号的分帧是采用可移动的有限长度窗口进行加权的方法实现。一般每秒33~100帧。加窗处理虽采用连续分段，但一般采用交叠分段的方法使帧与帧之间平滑过渡，保持连

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

声音识别基础知识重点分析.pptVIP

声音识别基础知识重点分析.ppt

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档