- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于小波包多频带分析MFCC算法改进
基于小波包多频带分析MFCC算法改进
摘要 MFCC算法是当前说话人识别系统中比较流行的语音特征提取算法,而小波分析以其独特的理论在信号处理、图像视频压缩等多个领域得到快速的应用。本文基于小波分析理论,对MFCC算法进行改进,提出全新的语音特征提取算法。
关键词 小波包;多频带;MFCC
中图分类号TP39 文献标识码A 文章编号 1674-6708(2014)115-0233-02
0 引言
MFCC完整算法最早由Davis于1980年提出,经过30多年的发展衍生出多个版本,这些改进版本主要分为两个大方向:1)使用不同数量的三角滤波器,如:MFCC FB-20、MFCC FB-24、 MFCC FB-40等,2)对提取的MFCC特征值做后续的处理,如:MFCC、MFCC。目前最常使用的是MFCC F20。
1 MFCC参数的提取
在语音识别系统中面临的第一个问题就是如何提取语音特征,语音特征提取的主要目的是减少计算量,但同时又要求该语音特征能表征出语音信号的独立性和完整性。MFCC算法参考人耳对不同频率的感知程度,可以达到上述两个目的,特别适用于语音系统。
1.1 预强调
将信号通过高通滤波器,用于抑制声源(声带)与人唇齿之间的效应,人为的提高信号高频部分的强度。
高通滤波器:H(z)=1-a* z-1 (1≥0.9)。
1.2 音框化
将信号每N个点划分为一个框,每个框之间有m个点的重叠区,如图1。这样做的主要目的是方便后面进行快速傅立叶变换,由于语音信号属于非平稳信号,而傅立叶变换对非平稳信号的分析有严重的缺陷,因此将信号划分为N点的框架,在框架范围内可认为信号是平稳信号,这中方法叫短时傅立叶分析。框之间有m个点的重叠区是为了避免音框过大而错过一些语征的提取。
1.3 汉明窗
将每个音框乘上汉明窗,用于增加相邻两框之间的连续性,加汉明窗后音框左右两端快速衰减至零,从而起到音框周期化的效果,大大的提高后期快速傅立叶变换的准确。
汉明窗:W(n,a)=(1-a)?Ca*cos(2πn/(N-1)),0nN-1;通常为0.46。
加窗后的输出:S’(n)=S(n)W(n) 。
2 小波包分析理论
小波包分析
小波变换使用两个基本的函数:母小波(mother wavelet)和小波(wavelet)。如haar小波:
haar小波:
haar母小波:
母小波相当于一高通滤波器,小波相当于一低通滤波器。
在做频域分析时母小波相当于对信号做高频分析,小波相当于对信号做低频分析,小波变换每次只对信号的低频部分做分析而高频部分(信号的细节)不再往下分析,但很多情况下对信号的高频部分的分析也是必须的,所以小波变换发展出小波包变换,在对信号低频部分分析的同时对高频部分也做同样的分析,就可以同时得到高频部分的详细信息,这对信号处理是非常有用的。
小波包分析的物理意义:
由于有海莫森测不准理论的存在,小波包分析不能像傅立叶变换那样能将信号的能量精确到某一个频率点上,因此只能得到某一频带内的能量,也就是说变换后的系数代表的是对应的变换的频率带宽下的能量系数。假设信号是一频率范围在0-100HZ之间的信号,经过第一级的分解得到了0-50HZ、50-100HZ之间的能量系数,以后的每一级的分解以此类推,需要强调的是经过多级分解之后,得到的能量系数不是按频率从低到高排序的[1]。而最终的带宽范围是多少取决于原信号的采样频率,通常△f=fs/2N。△f:最终带宽,fs:采样频率,N:信号的长度:小波包多频带分的MFCC算法的改进。
1)窗函数
如本文MFCC参数提取部分的叙述,窗函数的主要作用是将信号音框周期话,有利于之后的快速傅立叶变换(FFT),因为快速傅立叶变换是将信号隐式认为该段信号是一个周期内的,如不加窗函数可能导致快速傅立叶变换的不准确性,而使用小波包变换时完全不存在这样的问题。所以信加窗的过程可以省略。
2)FFT
MFCC算法需要用到的快速傅立叶变换是将信号的时域转换到信号频域,方便后续分析,且极大的保存原信号的特征,对于这点小波包变换完全可以实现。小波包变换完全可以代快速傅立叶的工作。
3)三角滤波器组
小波包变换最终得到的是信号在某一频带内的能量,而傅立叶变换得到的是某一频率采样点上的能量系数,因此需要对原有的三角滤波器组矩阵进行改进。原有的三角滤波器组的生成是以频率采样点生成的,在改进后的三角滤波器组矩阵是以最终频带宽度为单位生成的,如图3所示,改进后的三角滤波器组是某一频带下对应的三角滤波器上的面积。
经上述讨论本文将原有的MFCC算法做如
您可能关注的文档
最近下载
- 执业药师继续教育《前列腺癌常见其他治疗进展》习题答案.docx VIP
- 高一作文巧遇(2篇).docx VIP
- 人人峨嵋台地北缘断裂晚第四纪活动性.pdf VIP
- 肺淋巴瘤的影像诊断最全PPT【45页】.pptx VIP
- 血液透析中空气栓塞应急预案.ppt VIP
- 材料力学(刘鸿文主编).pdf VIP
- 2024-2025学年河北省保定市竞秀区北京师大保定实验学校八年级(上)月考数学试卷(9月份)(原卷全解析版).doc VIP
- Toshiba东芝软水机TS10-01 TS15-01 TS20-01用户手册.pdf
- 娄景书(娄景书).doc VIP
- 人教版高中英语新教材必修2单词默写表.docx VIP
文档评论(0)