基于小波变换语音特征参数提取.docVIP

下载本文档

19
0
约3.39千字
约 7页
2018-08-29 发布于福建
举报
版权申诉

基于小波变换语音特征参数提取.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于小波变换语音特征参数提取

基于小波变换语音特征参数提取　　【摘要】将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中，给出了一种新的语音特征参数――小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分，使频谱分辨率提高了一倍。试验证明，小波MFCC特征参数在较大词汇量情况下，其识别率优于MFCC特征参数的结果。　　【关键词】小波分析；语音识别；MFCC 　　Abstract：The multi resolution characteristic of wavelet is used to improve the front end processing of MFCC.So，a new feature parameter wavelet MFCC is presented in this paper.It uses wavelet transform，multi degree FFT and frequency synthesis to replace original FFT of MFCC，and increases spectrum resolution by 2.The experiments demonstrate that robustness and recognition rate of wavelet MFCC feature are better than one of MFCCs in large vocabulary. 　　Key words：wavelet transformation；speech recognition；MFCC 　　1.引言　　在语音识别和说话人识别中，基于Mel频率的倒谱系数MFCC（mel frequency cepstrum cofficient）是将人耳的听觉感知特性和语音的产生机制相结合，与其他特征参数相比较，体现了较优越的性能，在无噪声情况下能得到较高的识别率，因此是目前使用最广泛的特征参数。但是，随着识别词汇量的增大，这种参数的识别性能急剧地下降。说明这种特征不适合大词汇量识别。　　近年来，小波变换被广泛应用于语音处理中，主要包括：利用小波变换对听觉感知系统进行模拟，对语音信号去噪，进行清、浊音判断。因为小波变换的局部化性质，可以在很小的分帧长下对语音信号仍具有较高的频谱分辨率，本文将小波变换技术引入到MFCC特征参数中，来进行语音识别系统的特征提取，可以提高对辅音区的识别效果。因此，用WMFCC特征参数作为隐马尔可夫（HMM）识别网络的输入信号，识别效果明显提高。　　2.MFCC特征参数　　图1所示为MFCC特征参数的计算流程图。　　图1 MFCC特征参数的提取　　人类听觉系统对声音高低的感知与实际频率是一种非线性映射关系[1]，而与Mel频率成线性关系。根据人的听觉机理来进行Mel滤波器组的频带划分，模拟不同频率下人耳对语音的感知特性。实际频率和Mel频率的转换关系用公式（1）表示。　　其中Fmel是感知频率，单位美（Mel），F是以HZ为单位的实际频率。将语音的实际频率变换到感知频率中，能更好地模拟人的听觉处理过程。　　首先，将输入语音信号进行预处理，包括预加重、加窗分帧，然后作快速傅立叶变换，获得频谱分布信息；　　其次，将频域信号通过按Mel频率坐标分布的三角滤波器组。　　每个Mel三角带通滤波器的传递函数为：　　3.基于小波分析特征参数提取　　3.1 小波理论在语音识别应用基础　　传统的语音信号频谱是采用固定窗的傅立叶变换，在短时平稳的假设基础上得到的。　　傅立叶变换能够对窗内平稳信号（整个窗长度内信号特性相同）提供精确的频率分量。由于语音信号是短时平稳信号，由不确定性原理[2]可知，基于短时平稳假设的固定窗傅立叶变换将会模糊语音的细节特征，从而引起一些非常重要的信息丢失。小波理论是一种非平稳信号的分析方法，采用多分辨分析的思想，非均匀的划分时――频空间，能够有效地从信号中提取信息。具有时域局部性和频域局部性，并且其时频窗口可以根据不同频率自适应地调节，从而能精确地反映非平稳信号的瞬间变化。将小波变换引入语音信号的特征提取中，系统的识别性能能够得到一定的改善。　　与傅立叶变换类似，小波变换是将信号s（t）分解为若干基函数的线性组合。其基函数是。如果是正交小波基，那么信号可分解成小波基的组合：　　其中j为不同分辨率下标，j越大，表示分析的分辨率越低；j0表示最低分辨率；k为时间局部性下标；wjk代表信号在2jk时刻附近，2-jf0频率附近的值。尺度系数uk代表信号在2j0k附近平均值。随着分辨率的变化，能够在不同分辨率上得到小波细节，也就是高分辨的小