基于DSP的非特定人孤立词语音识别系统的研究和设计(王光东)概述.pptVIP

  • 10
  • 0
  • 约9.13千字
  • 约 48页
  • 2016-06-05 发布于湖北
  • 举报

基于DSP的非特定人孤立词语音识别系统的研究和设计(王光东)概述.ppt

Part 4 特征参数的提取与仿真 基本的特征参数主要有:能量、幅度、过零率、频谱、倒谱和功率谱等。 常用的常用的语音识别参数有线性预测参数(LPC),线性预测倒谱参数(LPCC)和Mel尺度倒谱参数(MFCC)等。 语音识别系统往往由于其训练使用不含噪的语音而导致识别的准确率在含噪的真实环境中会有大幅度的下降,其原因主要在于训练集和测试集的差别,因此识别系统的鲁棒性是其走向实用必须解决好的一个重要问题。 在此,详细介绍下基于特征空间的鲁棒语音识别技术——特征提取。 (这段话的含义) 特征提取是对语音信号进行数学处理后得到一个矢量序列,用这个矢量序列代表原始语音信号所携带的有用信息(去同存异)。在实际的语音识别系统中,特征参数的选择和提取是整个系统构建的基础,也是提高系统鲁棒性的理想方法。 一般语音信号的特征矢量可分为两类:第一类为时域特征矢量,即对语音信号的时域采样直接构成矢量序列,如端点检测中常用的幅度、能量和过零率等等;第二类为变换域特征矢量,即对语音信号进行某种变换后产生的矢量序列,如线性预测系数 LPC、LPC倒谱系数、短时频谱以及Mel频率倒谱系数MFCC等。其中MFCC是通过对人耳听觉系统的仿真而获得符合人耳听觉特性的语音特征参数,而不像LPCC那样依赖全极点语音信号产生模型的假定,因此具有良好的鲁棒性,被多数识别系统所采用。所以我们采用了MFCC

文档评论(0)

1亿VIP精品文档

相关文档