基于基音周期的语音MFCC参数提取.docVIP

  • 3
  • 0
  • 约4.17千字
  • 约 7页
  • 2018-04-07 发布于北京
  • 举报

基于基音周期的语音MFCC参数提取.doc

基于基音周期的语音MFCC参数提取   摘要:提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。   关键词:说话人识别;基音周期;MFCC参数;频谱距离   中图分类号: TP192.3   文献标识码:A      0引言??      在说话人识别研究中,由于语音的特征参数能有效地体现说话人语音所包含的与其他说话人不同的特点,为此,它在整个识别过程中起着至关重要的作用。目前,在说话人识别研究领域使用较多的有Mel频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、线性倒谱对(LSP)等。其中,MFCC参数是由Davis 和Mermelstein提出[1],主要描述的是语音信号在频率域上的能量分布,由于它能较好地模拟人耳听觉系统的感知能力。所以,多年来一直被说话人识别和语音识别研究人员作为一个重要的特征参数。但传统MFCC参数的提取存在两个不足:(1)它是在语音信号为短时稳定假设前提下进行的,也即是在10~30ms时间内,认为语音信号是近似稳定的[2]。但实际语音信号尽管可以看作短时近似稳定的,但仍然存

文档评论(0)

1亿VIP精品文档

相关文档