《基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数（MFCC）改进算法》.pdfVIP

下载本文档

26
0
约1.75万字
约 5页
2015-11-14 发布于河南
举报
版权申诉

《基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数（MFCC）改进算法》.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数（MFCC）改进算法》.pdf

第 14卷第 19期 2014年7月科学技术与工程 Vo1．14 No．19 Ju1．2014 1671～ 1815(2014)19—0253—05 ScienceTechnologyandEngineering ⑥ 2014 Sci．Tech．Engrg．基于多窗频谱估计和平滑幅度谱包络的 Mel频率倒谱系数 (MFCC)改进算法张怡然白静王力 (太原理工大学信息工程学院，太原030024) 摘要语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上，提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理，在预处理阶段，利用SWCE窗函数，对信号进行多窗频谱估计。并对得到的频谱进行平滑处理，得到信号的谱包络。然后对信号的谱包络进行计算，得到改进的MFCC参数。实验表明，在不同噪声环境下，与传统的MFCC算法相比，改进的算法识别率提高四个百分点以上。关键词 Me1频率倒谱系数多窗频谱估计滑动平均滤波谱包络说话人识别中图法分类号 TN912．3；文献标志码 A 说话人识别是语音识别的一种，属于语音信号说话人识别分为两个主要过程，即特征提取和处理的范畴。它利用说话人的声纹特征进行识别。模式识别。其中特征提取是说话人识别的关键问它先将说话人的语音训练成一个模板，然后从说话题。目前，在说话人识别系统中最常用的特征参数人的待测语音中提取说话人的个性特征信息，并对主要有 Mel频率倒谱系数 (Mel—frequencyceptrum 这些特征信息与训练好的模板进行比较，最终对说 coefficient，MFCC)、线性预测倒谱系数 (1inearpre— 话人的身份做出正确判断。说话人识别的原理框图 dictivecepstrumcoefficient，LPCC)、基因周期、感知如图1所示。根据识别目标的不同，说话人识别可对数面积比系数 (perceptuallogarearatio，PLAR)… 分为说话人辨认和说话人确认两种。前者是在若干等。MFCC特征参数更符合人耳的听觉特性，比其他个参考模板中判别出待识别语音是谁所说。后者是特征参数具有更优的识别特，所以是目前使用最广要判定待识别语音是否是所声明的人所说。本文研的特征参数。模式识别中常用的方法有支持向量机究的是与文本无关的说话人确认系统。 (supportvectormachine，SVM)、矢量量化方法、隐马尔可夫模型方法、动态时间规整方法和神经网络等。 1 MFCC参数的提取 1．1 MFCC参数因为人耳对外来的信号有不同的调节作用，所以对于不同频率的语音，人耳有不同的感知能力。在 1000Hz以下，感知能力与频率成线性关系，而在 1000Hz以上，感知能力则与频率成对数关图1 说话人识别的原理框图系 j。所以，人们提出更适合人耳听觉系统的Mel Fig．1 Theblockdiagram ofspeakerrecognition 频率。Mel频率的意义的是：1Mel为 100