语音识别的MFCC算法研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别的MFCC算法研究.pdf

现代商贸工业 No.3,2010 ModernBusinessTradeIndustry 2010年第 3期 语音识别的MFCC算法研究 熊 伟 罗云贵 (中国地质大学机械与电子信息工程学院,湖北 武汉 430074) 摘 要:详细介绍了一种在语音识别中取得一定 良好效果的Mel倒谱提取的改进算法。在语音识别 系统中,MFCC参 数是经常使用的特征参数之一。MFCC参数主要描述 了表征声道特性的谱包络特征 ,而忽略了基音频率对它的影响。然 而基音频率会影响MFCC参数对声道特性的准确描述,进一步影响语音识别系统的性能。提 出了一种 MFCC的改进参 数,该参数并不直接对语音短时幅度谱进行提取,而是首先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数 ,从而降 低基音频率对其 的影响。 关键词 :语音识别 ;梅 尔倒谱系数(MFCC);端点检测 中图分类号:TP 文献标识码 :A 文章编号:1672—3198(2010)03—0291—01 1 引言 号 。 语音识别技术的研究广泛的涉及到声学 、语言学 、语音 (2)通过将短时时域信号转化为频域信号月,并计算其 学、生理科学、数字信号处理、通信理论、电子技术、计算机 短时能量 ,离散傅里叶变换。将时域信号 x(n)后补若干 0 科学、模式识别和人工智能等众多学科,因此一个识别效果 以形成长为N(一般取 N:512)的序列,然后经过离散傅里叶 良好的语音识别系统 ,需要考虑包括说话人的心理状态、输 变换(DFT)后得到线性频谱 X(k),转换公式为。 入设备、说话环境多方面的因素。在实际应用中,一般多选 x(矗)一 z()e--j2~k/n,0≤ ,k≤ N一 1 取MFCC作为特征矢量来使用。因为人的听觉系统是一个 (3)在频标 内三角带通滤波器个加于坐标得到滤波器 比较理想的语音识别系统,而 MFCC(Mel倒谱系数)模拟了 组 ,转化关系为: 人的听觉特性,是符合人听觉特性的语音特征参量,在实际 应用中取得了较高的识别率。该特征谱 由Davies和 Mer- f L一 25951og(1+ fk/700) (4)求对数能量。为了使计算结果对 噪声和谱估计噪 melstein提出来的,并证 明了基于 MFCC特征参数 的语音 声有更好的鲁棒性,一般将上述经过 Mel滤波器组得到的 识别系统比基于其他特征参数的识别系统优越。 Mel频谱取对数能量。 2 MFCC参数的提取 则 由线性频谱 X(k)到对数频谱 S(m)的总传递 函数 经过对语音信号的预处理之后就要进行特征参数的提 为 : 取,在语音信号的特征提取中对特征参数的要求是。 (1)能有效代表语音特征,具有 良好的区分性。 e()= lx()1H (),0≤m M (2)特征参数之间有 良好的独立性。 S(优)一 in(e(m)),0≤ m M (3)特征参数易于计算 ,最好能保证语音识别的实时实 (5)离散余弦变换 。 现。 标准的倒谱参数 只反映语音参数 的静态特性,实际上 一 般将语音信号的特征参数分为两类

文档评论(0)

higu65 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档