- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
说话人识别特征参数MFCC提取与探析
说话人识别特征参数MFCC的提取与分析 摘 要
提取特征参数在说话人识别系统内是非常重要的步骤,说话人语音的很多特有个性信息包含于特征参数内,例如发声特征或者语义特征,利用特征提取的方法一方面可以去掉声音里没用的冗余信息,剩下有用的体现说话人个性不同的特征信息,特别是可以有效减少计算量、模板数目以及存储空间。选用的特征参数的会直接关系到整个系统的工作性能,良好的特征参数需要拥有好的稳定性和好的独立性,一方面可以不受到外界情况的干扰,不容易为其他的声音所替代,另一方面,能够较好的辨别不同说话人,说明说话人之间的差异
【关键词】特征参数 倒谱系数 LPCC MFCC
1 前言
当今说话人识别领域使用的特征参数有多种,它们各具特点,能够用于各种不一样的场合,其中应用较为广泛的具有代表性的特征参数是:基音频率、线性预测系数(LPC)、线性预测倒谱系数(LPCC)、梅尔倒谱系数(MFCC)
2 MFCC的提取与分析
梅尔倒谱系数(MFCC),MFCC是利用人耳听觉模型建立的倒谱系数,人类的听觉系统可以看成一个非线性系统,它对于不同的频率信号的灵敏度是不一样的,一般是对数型关系。正是由于Mel倒谱系数基于人耳感知这种特殊的特性,Mel倒谱系数在抗噪声能力以及鲁棒性这些方面都比其它特征参数要优秀了很多
对于不一样频率的语音,人耳有不一样的感知能力,声音的物理频率表示单位是梅尔(Mel)。频率和MFCC系数的关系如下式:
其中,f的单位为Hz。参照Zvick的研究所说,临界带宽按照频率不同而改变,在1000Hz以下时,维持线性分布,带宽在100Hz附近;在1000Hz以上时,表现为对数增长形式,如图1所示
Mel参数的提取过程:
(1)把之前预处理过的语音信号,即时域信号做傅里叶变化(DFT)。计算得到线性频谱x(k),其转换公式为:
(2)把上面的频谱x(k)通过Mel滤波器组生成Mel频谱
(3)接着对Mel频谱做对数能量处理,得到对数频谱S(m)。图2所列即为得到的线性能量谱,Mel能量谱和对数能量谱
上述第2步骤中提及的Mel频率滤波器组是在语音的频谱范围内设置的若干个带通滤波器表示滤波器的个数。f(m)表示滤波器组中的每个滤波器的中心频率,其传递函数如下所示:
式中Fs表示采样频率,N表示窗宽,f1、fh分别代表滤波器的频率应用范围的最低频率和最高频率,N表示窗宽,,为促进结果对噪声和谱估计的误差有更佳的鲁棒性,把上面通过Mel滤波器组获取到的Mel频谱取对数。因此经过线性频谱X(k)到对数频谱,S(m)的总传递函数是:
最后,将S(m)通过离散余弦变换(DCT)获得倒谱频域,即Mel频谱倒谱系数(MFCC参数):
参考文献
[1]M.Chetouani,M.Faundez-Zanuy,B.Gas,and JL.Zarader.Investigation onLP-residual representation for speaker identification,Pattern Recognition.2009,3(42):487-494.
[2]林琳,王树勋,郭刚.短语音说话人识别新方法的研究.系统仿真学报, 2007,19(10):2272-2275.
[3]姚志强.说话人识别中提高GMM性能方法的研究[D].北京:中国科技大学,2006:9-12.
作者简介
周春晖,男,浙江省人。硕士研究生学历。现为广东科技学院讲师
作者单位
广东科技学院 广东省东莞市 523083
您可能关注的文档
最近下载
- 空分车间安全用电管理制度.docx VIP
- 2025政府采购评审专家入库题库与答案.docx VIP
- 2025-2026学年小学信息技术(信息科技)三年级上册(2024)黔科版(2024)教学设计合集.docx
- 结构动力学(哈尔滨工业大学)中国大学MOOC慕课章节测验答案.pdf VIP
- 危险化学品企业安全生产检查重点事项指导目录.pdf VIP
- 月度绩效考核评分表(通用类).docx VIP
- CNAS-CL02-2023 医学实验室质量和能力认可准则.docx VIP
- 法医临床司法鉴定考试题.docx VIP
- 地面、墙面、吊顶施工方案汇总.doc VIP
- 新解读《GB_T 23169-2019发制品 教习头》最新解读.pptx VIP
文档评论(0)