语音截止频率在语音识别中应用.docVIP

  • 8
  • 0
  • 约3.09千字
  • 约 6页
  • 2017-12-07 发布于福建
  • 举报
语音截止频率在语音识别中应用

语音截止频率在语音识别中应用   摘 要:语音识别系统往往会受到说话人的改变、信道失真、环境噪声等各种因素的干扰,从而导致预先训练的声学模型与实际环境语音的特征参数之间存在较大的差异,这会严重影响语音识别系统在实际环境下的识别性能。由于噪声主要影响语音的高频非周期部分,传统的最大似然线性回归算法在噪声自适应中难以取得令人满意的效果。文章提出了一种基于语音截止频率的最大似然线性回归算法,以当前测试环境的语音截止频率为频率上限,提取测试语音的特征参数;然后,将声学模型每个高斯单元的均值和方差从倒谱域变换到对数谱域,根据语音截止频率,忽略其高频分量,再变换回倒谱域;最后,根据测试环境下的少量自适应数据,利用最大似然线性回归算法对声学模型的参数进行调整,使其与当前环境相匹配。 关键词:语音识别;语音截止频率;最大似然线性回归;模型自适应 1 引言 在实际应用场合,语音识别系统往往会受到说话人的改变、信道失真、环境噪声等各种语音变异性的干扰,从而导致预先训练的声学模型与实际环境下提取的声学特征之间存在较大的差异。因而需要对声学模型或声学特征进行补偿,减小环境失配的影响,提高语音识别系统在实际环境下的识别性能。 模型自适应是一种减小环境失配的有效方法,它通过测试环境下的自适应数据调整预先训练的声学模型的参数,使之与当前环境相匹配。一般来说,声学模型包含较多的参数,如果每

文档评论(0)

1亿VIP精品文档

相关文档